Command Line Texterkennung? - Was benutzt ihr?

D

dieter69

Gast
Hey!

Ich schlage mich grade ein wenig mit Schrifterkennung unter Linux herum.

Leider scheint keines der Programme mit meiner Schriftart klar zu kommen...
Tesseract hat villeicht 20% der Buchstaben richtig und versucht sie dann mittels Wörterbuchabgleich zu englischen Wörtern zu verwursteln. Meine zufälligen Strings stehen aber nicht im Wörterbuch!
Cuneiform lässt sich leider gar nicht über die Debian Paketquellen installieren :(
Und die restlichen Programme die ich getestet habe waren alle katastrophal bzw haben überhaupt nicht funktioniert!

Hat jemand von euch solch etwas im Einsatz? Bzw kann mir jemand sagen mit welchen Schriftarten tesseract klarkommt?
Im Wiki steht dazu nix..

Gruß
 
Falls du kein Problem mit kommerzieller Software mit GUI hast, könntest du die Testversion von Vuescan ausprobieren. Selbst habe ich keinerlei Erfahrung damit, habe nur darüber gelesen.
 
Mit command line Texterkennung kenn ich mich nicht so gut aus,

hab aber vorher die eingescannten Dokumente mit ScanTailor aufbereitet (http://scantailor.org/),

danach dann mit Abbyy FineReader (VM) erkennen lassen, ging wunderbar.


Wenn es also nicht unbedingt terminal sein muss:

evtl. die aufbereiteten Dokumente in PDF unwandeln und anschließend mal z.B. via PDF-XChange Editor (oder PDF-XChange Viewer) in WINE OCR laufen lassen
 
Zuletzt bearbeitet:
Zurück
Oben