Scan/OCR programm gesucht

Oakman

Ensign
Registriert
Mai 2006
Beiträge
216
Hallo,

ich suche ein Programm zur rudimentären Aufbereitung gescannter .pdfs (normaler Schriftverkehr). Es soll diese gerade ausrichten (das will der kleine Sheldon in mir) und halbwegs anständig OCRen. Des Weiteren müsste man einzelne Seiten in der .pdf löschen können.

Der große Acrobat kann das alles, ist mir jedoch schlicht zu teuer. Eine Alternative wäre der Abby Finereader; deutlich billiger, aber immer noch leicht schmerzhaft.

Kennt jemand weitere Alternativen?

Beste Grüße und vielen Dank!







 
Hi...

Evtl. bietet sich ja das kostenlose pdf24 an.
 
In mir wollte der Sheldon damals direkt einen guten Dokumenten Scanner kaufen.
Da ist nämlich oft eine gute OCR und sortieren plus Ausrichten Software dabei.
Fujitsu Scansnap z.B.
 
  • Gefällt mir
Reaktionen: fixedwater und species_0001
"Suche Software die alles kann. Darf aber nichts kosten!"

Spaß bei Seite, Acrobat Professional kann man auch noch ohne Abo kaufen. Die 2017er Version kostet in Anbetracht des Funktionsumfangs kein Vermögen.

Alternativ entsprechende Hardware + PDF24 o.ä.
 
Oakman schrieb:
Es soll diese gerade ausrichten (das will der kleine Sheldon in mir) und halbwegs anständig OCRen.
Ich denke da sicherlich zu weit…

OCR hinterlässt so weit ich weiß eine Form eines Fließtestes. Der ist wenigstens scon mal gerade.
Entweder ich will damit dann umgehen - dann brauche ich die PDF-Quellen im Keller und sonst nirgends - oder ich brauch diesen echten Text nicht sondern nur feingetunte… Bilder.

Und ausrichten… Da tue ich mit - Fotos! Also hätten dort Bilder gescannt werden sollen, aber es ist ja einfacher [Vorgabe mitgekommener Software? Kleine Files??] diese Scans (Bilder…) als PDF-Bilder abzulegen… …da ich ja nun mit OCR ansetzen will.

Ich gebe ja zu, dass ich auch meinen Vogel habe. Aber nun schon qualitativ nicht Optimales noch mal zu drehen? Neee, diese Qualitätsverluste tue ich mir nicht an. Und die Arbeit. Ich OCTRte das und hätte was zum Arbeiten. Oder ich OCRte nicht weil ich diese Darreichungsform gar nicht brauche.

CN8
 
Hallo Oakman und Hallo zusammen!

Unter Linux nutze ich eine kostenfreie alte (4.3.89) Version von Master PDF Editor.
Die freien Versionen von code-industry.net, die danach angeboten wurden und werden, haben außer beim OCR ein sichtbares Wasserzeichen in das PDF-Dokument gesetzt.
Also wenn man z.B. ein eingescanntes Formular darin ausgefüllt und gespeichert hat, war immer ein sichtbares Wasserzeichen zu sehen.

Ich scanne viele Dokumente als PDF ein. Sonst hatte ich zunächst immer Xsane verwendet und anschließend einen Master PDF Editor für OCR.
Aber ich fand heraus, das scheinbar die Qualität über Master PDF besser ist, trotz des selben Scanners.
Und OCR mit dem Master PDF Editor klappt super, wenn es also darum geht, die PDF zu durchsuchen.

Und es hat gegenüber Xsane noch einen Vorteil. Sind mehrere Seiten einer PDF einzuscannen, hat man mit Xsane die Form Dokument-0001.pdf, Dokument-0002.pdf. Das sind erst einmal Einzel-PDFs, die mit einem anderen Programm erst zu einer PDF zusammengeführt werden muss.
Beim Master PDF Editor kann ich bei mehreren Seiten gleich den Namen Dokument.pdf vergeben.

Aus der persönlichen Erfahrung heraus gesprochen war das jetzt.

Den Master PDF Editor gibt es auch für Windows und MacOS.

Gruß Andi
 
Zuletzt bearbeitet: (Ergänzung)
  • Gefällt mir
Reaktionen: Sommersocke
Bei mir kam die entsprechende Software, so eine Art Nuance light, direkt mit dem Brother AIO mit.
 
Andi07 schrieb:
…Sind mehrere Seiten einer PDF einzuscannen, hat man mit Xsane … zusammengeführt werden muss…
Du könntest dir mal gscan2pdf ansehen. Da kannst du in Ruhe alles einscannen, verschieben, sortieren und dann abspeichern.

Oakman schrieb:
…und halbwegs anständig OCRen…
Kannst du das etwas näher ausführen? Möchtest du nur durchsuchbare PDF haben oder den Inhalt separieren? Diverse File-Indexer können das nämlich bei aktiver Inhaltssuche schon von Haus aus, vielleicht ja auch die Windows-Suche? (Keine Ahnung von, sorry)
 
Für den OCR part kann ich dir tesseract empfehlen. Gibt sicherlich ein Projekt was darauf aufbaut mit den restlichen Funktionen.
Scan nachbearbeiten und ausrichten kann Scantailor, eventuell hat das auch tesseract integration da Google an beidem beteiligt ist.
 
Ich hab nach einer Handy app zum Scannen mit direktem OCR gesucht. Das beste und eines der wenigen mit OCR ist die App OfficeLens, ziemlich schlank, easy und das auch noch von Microsoft :D
 
Zurück
Oben