OCR-Software

Markus83Muc

Lt. Commander
Registriert
Apr. 2009
Beiträge
1.976
Hallo zusammen,

ich suche eine OCR-Software mit speziellen Anforderungen.

Erst mal zur Rahemenbedingung.
Ich habe ein Dokument (Word, PDF ...) welches ausgedruckt und unterschrieben wird. Anschließend wird es mit der Unterschrift drauf verscannt. Über das gescannte Dokument läuft dan OCR drüber um es in einem DMS-System abzulegen und dort Volltext indiziert zu haben.
Leider leifert der OCR-Schritt hin und wieder fehler, vorallem in Links bspw. wird V/ häufig zu W oder F_ zu E.
Dadurch funktioniert logischerweise die Volltextsuche nicht immer und Links führen häufig ins Nirvana.

Um dieses Problem zu beheben suche ich eine OCR-Software, oder auch ein anderes Verfahren, dem ich das gescannte Dokument und die Word-Datei geben kann und das anhand der Word-Datei die Texterkennung optimiert oder einfach den Text der Word-Datei hinterlegt.
Die Software darf gern kostenpflichtig sein. Falls es mit Adobe Pro einen weg gibt dies zu tun wäre es optimal, da ich dies momentan verwende.

Viele Grüße
Markus83Muc
 
Das ist dann aber eine Aufgabe für das Dokumentenmanagement-Programm und nicht für die OCR. Das DMS soll den Volltext für ein gescanntes Dokument nicht aus diesem, sondern aus einer Worddatei lesen.
Als möglichen Lösungsansatz könnte ich mir vorstellen, das Word-Dokument zu importieren und dessen Volltext zu indexieren. Das gescannte wird ohne OCR erfasst und mit dem Worddokument verknüpft, sodass beide bei der Volltextsuche gefunden werden.
Vielleicht könnte man auch mit Word ein PDF erzeugen und in dieses zusätzlich den Scan übernehmen.
 
Ob es mit Deinen Anforderungen klappt weiss ich nicht, hast Du Dir aber mal die Software von M$ angeschaut >>>> Microsoft Office Document Imaging und dem Microsoft Document Imaging-Format (MDI), ist doch im Office Paket enthalten. Worddokumente die damit gescannt werden können damit auch durchsucht werden. Habe mich damit allerdings noch nie richtig mit beschäftigt, teste es doch einfach mal. Kostet ja nix extra weil es im Paket enthalten ist.
 
werkam schrieb:
Ob es mit Deinen Anforderungen klappt weiss ich nicht, hast Du Dir aber mal die Software von M$ angeschaut >>>> Microsoft Office Document Imaging und dem Microsoft Document Imaging-Format (MDI), ist doch im Office Paket enthalten. Worddokumente die damit gescannt werden können damit auch durchsucht werden. Habe mich damit allerdings noch nie richtig mit beschäftigt, teste es doch einfach mal. Kostet ja nix extra weil es im Paket enthalten ist.

Bei mir (Office Plus 2010) ist das genannte Programm unter diesem und unter keinem andren Namen vorhanden.
 
bei 2007 unter Microsoft Office Tools (siehe screen), ggfs. unter Systemsteuerung/ Programme und Funktionen/anklicken -> ändern -> features hinzufügen -> vom Arbeitsplatz

in 2010 gibts es nimmer ersetzt durch One Note
 
Zuletzt bearbeitet:
Zurück
Oben