OCR bei schräg fotografierten Zeitschriften

Loved

Newbie
Registriert
Juni 2022
Beiträge
3
Hallo zusammen,

ich brauche für eine wissenschaftliche Arbeit Hilfe.
Grundlage sind circa 100 Jahre alte Zeitschriften, die für mich fotografiert wurden. Daher sind die Seiten etwas vergilbt und zum Teil die Seiten schräg, da es Doppelseiten sind.
Ich habe schon versucht, die Seiten zu teilen und dann OCR rüberlaufen zu lassen (kostenloses Onlineprogramm). Leider sind die Seiten dann zum Teil mittig geteilt. Und das OCR funktioniert nicht mal bei den geraden Seiten ganz.
Hat irgendwer eine Idee, was ich machen kann? Gibt es bessere Programme?
 
Es würde helfen zu sagen, ob es bessere Programme gibt, wenn du auch sagen würdest, was du bislang getestet hast.

Aber egal welche Software du verwendest, da wird ziemlich sicher viel manuelle Nacharbeit notwendig sein.

Für solche Zwecke finde ich im Übrigen die Forschung in Neuronale Netze ganz sinnvoll, OCR ist leider bei normaler Software aus meiner Sicht meist eher ernüchternd, wenn die Vorlage nicht gut ist.
 
Würde es mal mit gImageReader (verwendet die Tesseract engine) versuchen. Aber wie tollertyp schon sagte, wenn die Quelldateien Müll sind wird es schwierig ohne Vor- und Nacharbeiten.
 
  • Gefällt mir
Reaktionen: Demon_666
tollertyp schrieb:
Es würde helfen zu sagen, ob es bessere Programme gibt, wenn du auch sagen würdest, was du bislang getestet hast.

Aber egal welche Software du verwendest, da wird ziemlich sicher viel manuelle Nacharbeit notwendig sein.

Für solche Zwecke finde ich im Übrigen die Forschung in Neuronale Netze ganz sinnvoll, OCR ist leider bei normaler Software aus meiner Sicht meist eher ernüchternd, wenn die Vorlage nicht gut ist.
Ich muss direkt gestehen, dass ich mich echt nicht gut auskenne. OCR verwende ich, um nach Worten im Text zu suchen. Passen dazu Neuronale Netze auch? Wofür nutzt man die?

Bisher habe ich diese Seite verwendet: https://tools.pdf24.org/de/pdf-text-erkennen

danke schon mal für deine Antwort!!
 
Also ich meinte nicht, dass du dir ein neuronales Netz aufbauen/trainieren sollst (weil ich den Aufwand und Nutzen nicht abschätzen kann) - höchstens ein trainertes nutzen. Aber ein gut trainertes auf Texterkennung spezialisiertes neuronales Netz könnte wohl mehr rausholen als klassische OCR-Software.
 
und wo finde ich das? Sorry für die dummen Fragen...
 
Unter Umstaenden kann es mehr helfen, die schraeg fotografierten Zeitschriften gerade zu stellen bevor man eine OCR ueber das Gescannte jagt.

Keine Ahnung ob es z.B. den Abby Finereader noch in einer Trial-Version gibt.
Unter den Bezahlt-Tools war das Teil fuer mich eigentlich das Beste was wild Eingescanntes halbwegs vernuenftig per OCR lesbar machte.
 
Keine Ahnung. Geforscht wird auf jeden Fall in die Richtung, und macht Google mit den Captchas nicht auch Training für ihre neuronale Netze? Das heißt halt nicht, dass sie diese für andere unbedingt anbieten.

Und vielleicht wäre es gut, wenn du ein repräsentatives Beispiel hier mal posten würdest.

@BFF: Ich habe die Befürchtung, dass die Seite nicht als gesamtes "schräg" ist, sondern Teile, vor allem am inneren Rand, eben verzerrt sind. Aber ist nur eine Vermutung.
 
  • Gefällt mir
Reaktionen: BFF
Soll der TE raus finden.

Der FineReader konnte solch Art Verzerrungen beim Einscannen damals aus dicken Buechern per Flachbett durchaus haendeln. War zwar etwas Handarbeit dabei, aber es brachte gute Ergebnisse.
 
  • Gefällt mir
Reaktionen: tollertyp
Loved schrieb:
Gibt es bessere Programme?
Websuche schon genutzt? Natürlich gibt es bessere Software als die, vor irgendeinem Miniunternehmen was einen PDF Reader zusammengeschustert hat und vermutlich einfach nur irgendwelche Open Source Komponenten verwendet.

Finereader wurde ja schon genannt, OmniPage wäre ein nächster Kandidat und Readiris auch ein Schwergewicht, aber auf dem Markt tummeln sich natürlich auch andere Anbieter und Clouddienste.
https://www.capterra.com.de/directory/31459/ocr/software

Bei den meisten Anbietern, sollte es auch eine kostenlose Testversion geben, da kannst du dir dann am besten selbst einen Überblick verschaffen. Hier der Link zu Omnipage:
https://www.kofax.de/products/omnipage/ultimate-trial-version

Loved schrieb:
Hat irgendwer eine Idee, was ich machen kann?
Vor allem musst du dir damit ein wenig mehr beschäftigen, als die Dokumente irgendwo hochladen und auf Glück hoffen.

Der Grundgedanke bei den PDF Programmen war nie eine echte OCR Erkennung, sondern Verstichwortung der gescannten Dokumente. Daher sind die Funktionen dort eher dürftig gelöst, aber auch bei den "richtigen" Programmen ist Nacharbeit notwendig, vor allem wenn in Dokumenten Schriften verwendet wurden die der Software unbekannt sind.
 
Zuletzt bearbeitet:
wenn das keine guten Fotos sind hast du wenig Chancen mit OCR

ein Profi Buchscanner der die Seiten gerade fotografiert und noch dazu, in sehr hoher Auflösung, kann eher was werden

selbst dann muss viel mit Hand Arbeit nach korrigiert werden

Digitalisierung, von alten Schrift Werken, kostet sehr sehr viel Zeit und damit auch Geld
 
Ich habe vor einiger Zeit viel mit ocr experimentiert. Die besten Ergebnisse hat ausnahmslos Tesseract von google geliefert.
Wenn man noch etwas Gehirnschmalz in die Vorbereitung investiert (Batch-Bildbearbeitung z.b. mit imagemagick), sind die Ergebnisse wirklich gut bis fast fehlerfrei (natürlich auch abhängig vom scan / der Quelle). Gescannt wurde mit einem handelsüblichen Dokumentenscanner.
Das tool kostet nix und man hat viele Einstellmöglichkeiten, benötigt aber auch etwas Einarbeitung.
 
Demon_666 schrieb:
Ich habe vor einiger Zeit viel mit ocr experimentiert. Die besten Ergebnisse hat ausnahmslos Tesseract von google geliefert.
Wenn man noch etwas Gehirnschmalz in die Vorbereitung investiert (Batch-Bildbearbeitung z.b. mit imagemagick), sind die Ergebnisse wirklich gut bis fast fehlerfrei (natürlich auch abhängig vom scan / der Quelle).
Ich mag Tesseract auch, hab grad bemerkt, dass ich es hier noch nicht installiert hatte.
Stimmt absolut, gute Vorbereitung des Materials ist das A und O. Hab's grad ausprobiert: Wenn man den zu scannenden Text z.B. leicht schräg stellt, geht die Erkennung in den Keller. Ergebnisse im Screenshot jeweils ohne Korrektur.
Y0629_1250-2.png - gImageReader_20220629_1322-1.png
 
Zurück
Oben