OCR Software mit speziellen Anforderungen

Benzer

Fleet Admiral
Dabei seit
Nov. 2007
Beiträge
16.200
Hallo zusammen,

ich muss immer ein und das selbe Dokument verarbeiten.
Die Inhalte sind veränderlich, die Position ist immer gleich.

Beispielsweise ist unten eine Tabelle in der sind die Artikelnamen aufgeführt.
Die Position der Tabelle ist immer die gleiche, jedoch der Inhalt ändert sich.

Kennt jemand eine OCR Software in der ich solche Felder definieren kann und die mir dann diese in eine Datenbank / Excelliste / Textdatei oder ähnliches schreibt?

VG
 

Highspeed Opi

Admiral
Dabei seit
Nov. 2007
Beiträge
8.526
Microsoft Excel bietet die Funktion einzelne Abschnitte, Felder, Seiten, etc. aus allen möglichen Quellen (auch Internet) herauszulesen und in vordefinierte Zellen zu schreiben.

Microsoft OneNote bietet die Funktion Dokumente mit OCR als Text darzustellen.

Es gibt gute physische Scanner für ca. 500 Euro, welche mehrere physische Dokumente einscannen, mit OCR erkennen du diese entsprechend durchsuchbar/lesbar für alle möglichen Tools und Programme macht.

Mit anderen Worten:
Microsoft Office hat bereits integrierte Funktionen dafür und physische Scanner ebenfalls.
Es ist weniger die Frage ob es geht, sondern wie die Quelle aussieht, wie fähig man selbst ist es einzurichten und wie entscheidend Übersetzungsfehler sind.
Egal welche OCR Software du nimmst, keine arbeitet perfekt. Nicht mal digitale oder digital gedruckte Schrift mit Standard-Schriftart wie Arial, wird zu 100% erkannt.

Da ich selbst alle drei Möglichkeiten bereits genutzt habe und ab und zu noch nutze, kann ich sagen, dass Zahlen besser als Schrift erkannt werden.
Bei Zahlen habe ich beispielsweise beim Spiel "EVE Online" ca. 50.000 Quellen bzw. Zahlen ausgelesen und diese waren zu vielleicht 99% korrekt. Bei digitaler Schrift war es eher um die 95%. Bei physisch eingescannten Tabellen waren es ca. 80%...

Excel "externe Daten abrufen"
OneNote "OCR"
 
Zuletzt bearbeitet:
Top