Daten aus Bilddatei auslesen

Registriert
Jan. 2015
Beiträge
3
Hallo zusammen,

ich habe folgendes Problem: Aus einer Tabelle, die leider nur als Bild vorliegt, muss ich die Daten einer Spalte auslesen. Es handelt sich um Felder in drei verschiedenen Farben sowie Ziffern in diesen Feldern, die ebenfalls drei unterschiedliche Farben haben können. Ich benötige also die Informationen Feldfarbe, Ziffer und Ziffernfarbe in einem bearbeitbaren Format.

Da ich die Datei mehrmals am Tag neu bekomme, wäre eine nicht-händische Lösung meine Rettung. Hat vielleicht jemand einen Tipp für mich?
Ich bin für jeden kleinen Hinweis sehr dankbar.

Grüße
Alexandra
 
meiner Meinung nach nicht machbar. Lieber versuchen an der Quelle was zu machen, sprich iwie die Datei als Tabelle (bearbeitbar) und nicht als Bild (statisch) zu bekommen.
 
OCR Software kann sowas prinzipiell. Aber... das Ergebnis von sowas ist abhänging von der Qualität der Grafik und den Filtern der Software. Dazu kommt, das diese Art der Software aus dem Bild im Prinzip dann nur eine Excel Datei macht mit der du dann weiterarbeiten kannst. Aber so ein Verfahren ist fehleranfällig.

Picard87 Tipp ist hier eigentlich der richtige... die Lösung muss von der Quelle kommen. Die Datei sollte dir schlichtweg nicht als Bild zugestellt werden, sondern als Excel oder in was auch immer die erstellt wurde.
 
Vielen Dank für die Antworten. Das Problem ist leider, dass ich die Datei nur als Bild bekomme. Die OCR-Software von Omnipage und Adobe kann mir leider auch nicht weiterhelfen, weil die Farben der Felder nicht erkannt werden.

Ich hänge mal ein Beispielbild an. Vielleicht gibt es hier ja einen Spezialisten auf diesem Gebiet, der noch eine Idee hat.
Tausend Dank schon mal.

10daxsreen301222014_-_Kopie~3.jpg
 
Du kannst dein Glück mit Werkzeugen wie Tesseract versuchen, aber ich bezweifle, dass du viel Erfolg haben wirst. Der Farbensalat wird die meisten OCR-Programme aushebeln. Da erkennt man ja als Mensch schon kaum was. Du könntest es OCR zwar etwas leichter machen, wenn du das Bild entsättigst und Kontrast+Helligkeit optimierst, um die Zahlen stärker hervor zu heben... aber dann wären deine Farbinformationen weg.

Fakt ist: Bilder sind Scheiße. Bilder sind toll für Menschen, aber ganz ganz mies für Maschinen. Lass dir die Daten maschinenlesbar geben. XML, JSON, CSV, irgendwas... aber nicht so ein Pixelbrei.
 
Grundsätzlich kannst du eine Schrifterkennung drüberlaufen lassen, der werden die Farben aber relativ egal sein. Wenn die Bilder immer so aufgebaut sind sollte dir aber ein Programmierer mit Erfahrung in Bildverarbeitung weiterhelfen können, ist halt die Frage ob du da Geld ausgeben möchtest bzw jemanden findest der dir das aus Spaß programmiert. Selbst dann wirst du sicherlich nur 99,9% der Zahlen richtig bekommen, sprich jede 1000. Zelle (oder so) wird falsch erkannt werden.

Das wäre der Moment wo du dann den Urheber der Bilder mal nett fragst, ob er die Daten auch als Text zur Verfügung stellen kann, der wird nämlich nichts anderes machen als Text in Bilder umzuwandeln, sprich er hat die Daten auch in einem gängigen Format...
 
Ich sehe kein großes Problem darin ein Programm wie von der TE gewünscht zu schreiben. Allerdings wird man (wie bei Bilderkennung eigentlich immer) mit einer geringen Fehlerquote kleiner 1% rechnen müssen. Da die Eingabedaten sehr gut ausschauen wird man die Fehlerquote wohl sehr niedrig halten können.

Um so ein Programm zu schreiben bräuchte man aber erstmal eine genau Beschreibung was das Programm können soll (Format der Eingabe, ist die Eingabe immer exakt! so formatiert wie auf dem Bild, ist nur die mittlere Spalte relevant, welche Farben und Farbkombinationen sind möglich, in welchem Zahlenraum liegen die Zahlen, Ausgabeformat etc.) und auf welchem System es laufen soll. Ob dafür jemand kostenlos seinen Sonntag opfert halte ich für fraglich.
 
Nochmal vielen Dank an alle für die Infos, ihr habt mir sehr geholfen. Selbstverständlich bin ich bereit für so ein Programm angemessen zu bezahlen. Jetzt weiß ich, dass sowas überhaupt möglich ist. Toll, dass einem Newbie wie mir hier so schnell geantwortet wird. Ihr seid klasse.
 
Zurück
Oben