Texterkennung mit Orc und Acrobat Stapelverarbeitung

ignator

Ensign
Registriert
Juli 2004
Beiträge
234
Hallo (Titel soll eigentlich OCR lauten und nich Orc :-),

Wir bekommen im Wochentakt etwa 300 PDF Dateien, die wir einscannen und über die Stapelverarbeitung in Acrobat umbenennen. Wir durchsuchen dabei die zu verarbeitende Datei die vorher eingescannt und per OCR lesbar gemacht wurde nach einem bestimmten Ausdruck.

Manchmal kommt es vor, dass das OCR Script text nicht lesen kann und somit an dieser Stelle ein Fehler generiert wird. Das ist etwa in 15% aller PDF's der Fall.

Gibt es einen Weg dem Acrobat OCR beizubringen "besser zu lesen und umzuwandeln"?

grüße

Michael
 
Zuletzt bearbeitet:
Ich kenne das in den Acrobat integrierte OCR-Modul nicht. Aus den Informationsseiten des Herstellers und verschiedener anderer Seiten geht hervor, dass man lediglich ein paar Einstellungen für den Scan der Seiten verändern kann.

Auflösung, Graustufen oder Farbmodell, Ausgabeformat, ...


Mit vermittelt das den Eindruck, dass das Modul nicht mit den "richtigen" OCR-Scannern konkurrieren kann und dies vielleicht auch gar nicht im Sinn von Adobe liegt. Es ist einfach ein Modul eines Gesamtpakets und nicht die Hauptfunktion einer Software.

Ich würde die Testversion von Abbyys FineReader installieren und testen, ob ihr mit dem Paket bessere Ergebnisse erreicht.


Christine A.
 
Zurück
Oben