Durchsuchbares PDF: Abby Finereader PRO - Omnipage 19 PRO --> Dateigröße

TobiasSchneider

Lt. Junior Grade
Registriert
Okt. 2009
Beiträge
471
Hallo

ich habe mir auf Grund er aktuellen Werbung zusätzlich zu meinem geliebten Finereader doch mal wieder Omnipage PRO gekauft. Das was mich interessierte war die in der Werbung beworbene Funktion von OP, dass es bei der batch Umwandlung von PDF Bilddateien und durchsuchbaren PDFs erkennt, welche letztere sind. Das Ziel der Erkennung ist, jene mit TEXT Ebene nicht noch mal zu erkennen / OCR. Nuance Omnipage sagt hier, dass jener Vorgang nämlich das Ergebnis verschlechtern könnte / würde und gleichzeitig wird beworben, dass nur das neue OP das kann.

Ok, sehr interessant und gekauft ohne großartig im Netz zu recherchieren.

Mein Problem ist, dass ich nun testweise mal einen Ornder meiner täglichen Arbeit gewählt habe und diesen an die batch engine Docudirect von Omnipage weitergeleitet habe mit dem Ergebnis, dass die erkannten PDFs von Omnipage bis zum Faktor 5 größer sind als jene von Finereader :(

GIbt es Expoerten hier, die ebenfalls beide Programme nutzen und ähnliche Erfahrungen oder sogar Lösungen haben?
(die Einstellungen beider Programme für Genauigkeit und MCR sollten vergleichbar sein).
 
Wenn das stimmen sollte, dann haben Sie endlich auf 12 Jahre Kundenbeschwerden, wegen des miserablen Supports, reagiert. Zumindest was die Unterstützung der Paperportcommunity betrifft.

Ich werde es probieren.
 
die frage ist... was genau willst du erreichen, mit was für vorlagen...
und was bedeutet faktor5? fünf mal bessere texterkennung oder fünf mal vergrössern des fotos?

jede texterkennungssoftware hat spezifische vor und nachteile. welches tool nun für handschriftlich gescannte notizen besser ist.... das hat auch was mit papier, scanauflösung, farbe der schrift, bildanteil und noch vieles mehr... zu tun.
pauschale aussagen sind also eher ein raten, auch wenn man keines dieser zwei tools selber besitzt und testen kann.
 
Faktor 5 = Dateigröße
Eine 800KB PDF wurde zur 2MB Datei (okay, ist Faktor 2.5).

Ich kann nun festhalten,
dass ich mit dem eDiscovery Konvertierungstaks in Omnipage Ergebnisse erziele, die ähnlich oder besser sind von Finereader. Größe und optische Qualität sind vergleichbar aber bei Omnipage habe ich festgestellt, dass die OCR Qualität sogar besser ist.
Ich habe bei beiden eingestellt, eine genaue OCR Qualität zu nehmen anstatt einer schnellen, die Bildqualität ist auf "mittel" und MCR mit 300
DPI eingestellt. Es geht wie gesagt um die Konvertierung von PDF-Bild zu PDF-Text bzw durchsuchbaren PDF Dateien.
Die OCR Qualität habe ich an nur einer! Datei bisher bestimmt. Also meine Ausage ein paar Sätze zuvor. Ich habe dazu 5 Seiten eines Magazins vom Kios gescannt. Der Hintergrund war ein wenig gelblich anstatt weiß :) und es gab ein paar Bilder und Schrift in normaler Größe...Ich könnte das mal hochladen.
Dann jeweils OCR drüber und im PDFprogramm geöffnet (PdfViewerPRO) und dort den erkannten Text markiert, kopiert und in Word eingefügt. Festzustellen war, dass beide tools alles super erkannt haben nur dass Finereader häufiger Leerzeichen zwischen Buchstaben innerhalb von Wörtern einfügte. War bei OP nicht festzustellen. Das freut mich sehr andererseits befürchte ich, dass ich nun jahrelang nicht den optimalen OCR Text erhalten habe, da ich jahrelang glücklich mit FR gearbeitet habe...
 
Zurück
Oben