OCR aus Bild mit Wortschatzvorgabe

finester

Newbie
Registriert
Juli 2015
Beiträge
3
Hi,

ich habe im Forum bereits ein wenig gesucht bin aber leider nicht fündig geworden.
Ich bin auf der Suche nach einem Tool, dass es mir ermöglicht Text aus einem Bild zu extrahieren.
Habe mich bereits mit dem OCR von Google Drive versucht, leider nicht mit dem erwünschten Erfolg.

Da ich die Text-Elemente, welche in den Bildern vorhanden sind bereits kenne, wäre es möglich diese also Vorgabe/ Vorlage zu hinterlegen. D.h. ich würden den Wortschatz der erkannt werden soll vorgeben. Somit sollte die Fehlerquote verringert werden. Gibt es hier denn bereits eine Lösung?

Zudem wollte ich fragen, ob es auch eine Möglichkeit gibt, die Formatierung vorzugeben. Oder auch Farbelemente zu erkennen und entsprechend eine Textzeile hierzu auszugeben.

Schon mal vielen Dank für die Antworten und fürs durchlesen.

mfg
finester
 
Hi,

Da ich die Text-Elemente, welche in den Bildern vorhanden sind bereits kenne, wäre es möglich diese also Vorgabe/ Vorlage zu hinterlegen. D.h. ich würden den Wortschatz der erkannt werden soll vorgeben. Somit sollte die Fehlerquote verringert werden. Gibt es hier denn bereits eine Lösung?

die einzelnen "Textelemente" sind so oder so alle bekannt (Alphabet). Das ändert nichts, nur weil du Wörter vorgibst. Jede gute OCR - gerade solche wie Google oder andere Cloud- und distributed Systeme - arbeitet mit einem Wörterbuch.

So speziell wie du es dir vorstellst glaube ich erstens nicht, dass es fertige Software gibt (das heißt selbst entwickeln oder programmieren lassen) und zweitens kann ich mir nicht vorstellen, dass die Erkennungsquote damit hoch genug wäre. Zeig mal bitte ein konkretes Beispiel für den Anwendungsfall, den du beschreibst.

VG,
Mad
 
Hi Madman und danke für deine Antwort.

Ich hätte vielleicht hinzufügen sollen, dass es sich bei dem Wortschatz größtenteils um Namen handelt. D.h. das ganz normale Alphabet erzeugt häufiger Fehler.

Ein Bild kann ich später hinzufügen, habe ich atm nicht parat.
 
Hi,

naja, dann muss aber Schriftart / Typografie etc auch immer passen.

Als Beispiel: mit einzelnen Buchstaben kriegst du "Susonne", wenn das "a" nicht korrekt gelesen werden kann. Wenn du nur nach dem Wort suchst findet er dabei dann gar nichts. Halte ich auch nicht für besser / schneller / genauer. Zumal wie gesagt eh eine gute OCR Software auch mit Datenbanken / Wörterbüchern abgleichen kann. Dann wird das "Susonne" genommen, mit der Datenbank verglichen, der Kontext verglichen usw.

Bild wäre super, falls du da was hast.

VG,
Mad
 
Zurück
Oben