OCR-Empfehlung (Texterkennung/Dokumentenarchivierung)

Jo70

Ensign
Registriert
Juli 2018
Beiträge
202
Hallo!

Gerade (be-)stelle ich der jüngeren Verwandtschaft eine einfache, m.E. preisgünstige Windows-Homeoffice-Situation zusammen. Bestellt sind dieser Laptop und dieses AiO-Gerät. Anfangs soll ein Haufen Dokumente eingescannt und als .pdf gespeichert werden. Ich halte es für sinnvoll, diese möglichst direkt mittels Texterkennung durchsuchbar zu machen.

Ich selber nutze auf meinem Desktoprechner eine veraltete Adobe Acrobat-Version dafür, habe darüber hinaus aber nur sehr wenig Erfahrungen.

Die bedachte Person hat noch sehr wenig Erfahrung mit Windows-PCs, womöglich noch nie selbst ein Dokument eingescannt. Die Anwendung/Bedienung sollte also möglichst einfach und Idiotensicher sein. Installieren und nötigenfalls einrichten würde ich das Programm.

Könnt Ihr mir OCR-Software empfehlen? Ideal wäre natürlich umsonst/open source, falls nötig/sinnvoll darf es aber auch etwas kosten.

Übrigens gehe ich stand heute davon aus, dass LibreOffice (lokal) genutzt wird.
 
Was soll da ueberhaupt wirklich passieren?

Jo70 schrieb:
Ich halte es für sinnvoll, diese möglichst direkt mittels Texterkennung durchsuchbar zu machen.

Loeblich fuer Dich. Nur will das die Verwandschaft? Und Du weisst das das die reine Durchsuchbarkeit nix mit Verwaltung zu tun hat?

Fuer das reine Einscannen plus OCR reicht eigentlich schon NAPS2.
Ob bei dem Scanner mit was dazu kommt schau ich nicht nach.
 
  • Gefällt mir
Reaktionen: redjack1000
BFF schrieb:
Was soll da ueberhaupt wirklich passieren?
Papiere (vorwiegend Schreiben/Post) soll als .pdf gespeichert werden, damit sie
  • nicht mehr verloren gehen,
  • am Bildschrim gelesen werden und
  • per Mail verschickt werden können.

BFF schrieb:
Loeblich fuer Dich. ... Und Du weisst das das die reine Durchsuchbarkeit nix mit Verwaltung zu tun hat?
Worauf willst Du mich mit den Stichwort Verwaltung hinweisen? Kann gut sein, dass ich da noch etwas dazu lernen kann.

Ich hab Eure naps2-Empfelung gesehen und beschäftige mich nun damit. DANKE!
 
Zuletzt bearbeitet:
Bitte.

Jo70 schrieb:
nicht mehr verloren gehen können,

Dann trainiere auch das Backup der eingesannten "Papiere".
Weil geloescht ist geloescht. Und wenn das Papier wovon gesannt wurde auch wech ist, ist alles wech.
 
  • Gefällt mir
Reaktionen: Jo70
Jo70 schrieb:
nicht mehr verloren gehen können,
Und das Backup solltest du anlegen und testen, bevor du das System scharf schaltest. Mit testen meine ich nicht nur das Backup erstellen, sondern auch die Wiederherstellung inkl. DesasterRecovery.

CU
redjack
 
  • Gefällt mir
Reaktionen: BFF
Die von Canon mitgelieferte Scan-Software hat OCR mit an Bord. Du musst lediglich den Modus "Dokument" beim Scannen verwenden, dann läuft die OCR automatisch drüber und erstellt ein unsichtbares, maschinenlesbares Layer über der Grafik.
 
Danke für den Canon-Hinweis! Das habe ich bei der Produktbeschreibung übersehen. Ich hab auch selbst ein (anderes/älteres) Canon AiO-Gerät, nutz(t)e das CanUtility aber nie.

Wahrscheinlich erst morgen will ich aber NASP2 schon mal an meinem eigenen Rechner ausprobieren.

Das Sitchwort DesasterRecovery liest sich sehr interessant. Es fällt mir schwer mich schon heute damit näher zu befassen, weil der Laptop ja gearde erst bestellt ist, Windows etc. noch intsalliert und eingerichtet werden muss. Falls Du aber einen guten Hinweis-Link (zu einem Artikel oder sost einer Erläuterung zum Thema) ohne Aufwand partat hast, wäre es nett Du postet es hier, damit ich ca. nächste Woche einen guten Startpunkt habe. Dank vorab!
 
Jo70 schrieb:
Worauf willst Du mich mit den Stichwort Verwaltung hinweisen?

Auf das Wiederfinden.
Eine halbe Million Dokumente eingescannt und irgendwo abgelegt ist immer noch nicht das, womit man etwas wieder findet. Dateiexplorer ist untauglich und macht keinen Spass.

Dateinamen sind Schall und Rauch und die kommen auch an ihre Grenzen weil das menschliche Erinnerungsvermoegen einfach mal nicht zu Dateinamen passt.
Ergänzung ()

Jo70 schrieb:
für den Canon-Hinweis

Gewoehne niemanden an ein Scanner-Herstellerprodukt.
Was ist, wenn ab Weihnachten ein Epson eingesetzt werden muss? 😉
 
  • Gefällt mir
Reaktionen: M-X und redjack1000
Stichwort: Wiederfinden
Ich selber habe beim Speichern mein eigenes System, was aber auch Konsequenz/Arbeit beim Ablegen und der Benennung der Dokumente erfordert. Wie machst Du das, bzw. wie kann man das ideotensicher gestalten?
 
Jo70 schrieb:
alls Du aber einen guten Hinweis-Link (zu einem Artikel oder sost einer Erläuterung zum Thema) ohne Aufwand partat hast, wäre es nett Du postet es hier, damit ich ca. nächste Woche einen guten Startpunkt habe. Dank vorab!
Bitteschön -> https://www.kreyman.de/index.php/mi...nt-for-windows-installation-und-konfiguration

Meine Empfehlung, Windows installieren, Treiber installieren, Updates installieren, Backup einrichten und druchführen, DesasterRecovery Medium erstellen, Datenträger mit Windows löschen, DesasterRecovery durchführen. Wenn das klappt, Laptop vollständig einrichten.


Jo70 schrieb:
was aber auch Konsequenz/Arbeit beim Ablegen und der Benennung der Dokumente erfordert. Wie machst Du das, bzw. wie kann man das ideotensicher gestalten?

Ich mache das gar nicht, ich überlasse das meinem DMS "paperless-ngx". Dokumente werden gescannt, vom DMS gespeichert und ausgewertet. Wäre ja noch schöner, wenn ich mich um speichern kümmern müsste.
Mir ist das egal wo und wie das gespeichert wird, wenn ich was suche, soll die Suche vom DMS sich darum kümmern.

Cu
redjack
 
Zuletzt bearbeitet:
Beschaeftige Dich mit DMS. @Jo70

Die gibt es auch fuer kleines Geld fuer Privat wenn nicht sogar fuer lau.


Jo70 schrieb:
Wie machst Du das, bzw. wie kann man das ideotensicher gestalten?

Es gibt kein Idiotensicher.
Privat -> ecoDMS
Fuer die die Arbeit macht das eine Warenwirschaftssoftware.
Ergänzung ()

Jo70 schrieb:
Die bedachte Person hat noch sehr wenig Erfahrung mit Windows-PCs

Was meint eigentlich die bedachte Person dazu?
 
Die bedachte Person freut sich über die geschenkten Geräte und anerkennt das Problem der bisherigen (analogen) Zettelwirtschaft. Mit welcher Konsequenz sie dann den von mir gewünschten Weg geht wird sich zeigen.
Zumindest waren die Gerätschaften bislang eher preisgünsig.
 
redjack1000 schrieb:
Ich mache das gar nicht, ich überlasse das meinem DMS "paperless-ngx". Dokumente werden gescannt, vom DMS gespeichert und ausgewertet. Wäre ja noch schöner, wenn ich mich um speichern kümmern müsste.
Das stimmt aber auch nur halb. Das system will trainiert werden und Korrespondenten, Tags, Dokumententypen etc muss man schon anlegen und pflegen sonst hat man auch nur ein DMS mit Haufen PDFs. Es ist aber definitiv schneller als alles manuell im Dateiexplorer zu machen.
 
  • Gefällt mir
Reaktionen: redjack1000 und BFF
Jo70 schrieb:
Die bedachte Person freut sich über die geschenkten Geräte und anerkennt das Problem der bisherigen (analogen) Zettelwirtschaft.

Also machst Du lebenslangen Support. Respekt.
Die/eine digitale Zettelwirtschaft wird es nicht besser machen.
 
Naps2 ist eine gute Lösung.

Ich persönlich würde mich da aber gar nicht mehr mit nem Scanner umtun, sondern der Person einfach ne Scanner-App aufs Handy packen, die automatisch OCR macht. Das versteht normalerweise jeder, der mit nem Smartphone halbwegs umgehen kann und es geht VIEL SCHNELLER, als die Dokumente zu scannen. Auch wenn es nicht ganz so sauber ist, reicht die Qualität normaleriweise mehr als aus. Für das Backup kann man je nach Handy ein entsprechendes Sync-Tool (z.B. SyncThing) konfigurieren.

Wenn das nix ist, kannst du dir auch mal OCRmyPDF angucken. Das hat keine grafische Oberfläche, man könnte das aber auf ein ganzes Verzeichnis von Scans im Hintergrund laufen lassen.

Als letztes wäre da noch Paperless ngx als Komplettlösung. Dafür müsstest du einen "Server" laufen lassen, aber das lässt sich problemlos auf nem Raspberry PI betreiben. Dort könntest du dann auch einen Sync-Job entweder in die Cloud oder auf eine weitere externe Festplatte laufen lassen.

Wenn es eher grafisch sein soll, könntest du auch den für privaten Gebrauch kostenlosen PDF Xchange Editor nutzen.
 
  • Gefällt mir
Reaktionen: Jo70
Zurück
Oben