Start in ein papierloses "Büro"

whigga

Lt. Commander
Registriert
Jan. 2009
Beiträge
1.397
Moin Leute,

ich spiele schon seit längerer Zeit mit dem Gedanken, meinen ganzen Papierkram zu ordnen, auszusortieren und alles zu digitalisieren. Bisher habe ich lediglich die Windows-eigene Scanfunktion mit nem HP Multifunktionsgerät genutzt, würde mir aber gerne auch ein neues Gerät dafür anschaffen. Zuvor habe ich allerdings noch ein paar Fragen, die mir hier hoffentlich jemand beantworten kann:

1.) Bevor ich das Vorhaben starte, wäre es für mich interessant zu wissen, welche Dokumente man am Ende im Original aufheben muss. Mein Ziel ist es, so wenig Ballast wie möglich zu behalten. Mir ist klar, dass ich hier keine Rechtsberatung erhalte, allerdings treiben sich hier sicher Leute rum, die mir da weiterhelfen können.
Muss ich also so etwas wie originale Gehaltsabrechnungen aufbewahren? Oder sind Kopien genauso gültig?

2.) OCR - da ich kein DMS benutzen möchte, sollen die PDF-Dateien über die Suchfunktion im Betriebssystem auffindbar sein. Ich benutze Primär macOS, möchte aber auch, dass das ganze auf Windows-Rechnern funktioniert.
Jetzt konnte ich nicht so richtig rausfinden, an welcher Stelle des Scanvorganges OCR zum Einsatz kommt, bzw. ob das der Scanner als Hardware, oder die Scansoftware übernimmt?
Gibt es da verschiedene Implementierungen/Standards/whatever, welche ich bei der Auswahl von Soft- und Hardware berücksichtigen sollte? Oder geht es frei nach dem Motto "entweder der Text ist erkannt, oder eben nicht"?

3.) Hard-/Software: Wir sind zwei Privatpersonen. Nachdem der aktuelle Bestand digitalisiert wurde 8hierfür werde ich mir ein Gerät mit Dokumenteneinzug leihen), werden im Monat vielleicht 10 Seiten gescannt. Primär soll das ganze am Macbook stattfinden, weswegen ich ein kleines, handliches Gerät bevorzuge, welches per USB angeschlossen werden kann und darüber auch den Strom bezieht. Duplex möchte ich schon gerne haben, ob das Teil jetzt aber 10 oder 20 Sekunden für den Scan einer Seite braucht, ist mir da relativ Wumpe. Reicht da so ein einfaches Brother-Gerät vom Amazon?
 
  • Gefällt mir
Reaktionen: Hänri
Hi @whigga,

ich behalte lediglich analoge Lohnabrechnungen, Dokumente vom Staat (Sozialversicherungsausweis, 2FA Kram, etc.) und Dokumente die meine Partnerin und mich betreffen. Der Rest kommt in den Schredder.

Da man die Dokumente eigentlich nie braucht, habe ich auf OCR verzichtet und "scanne" das direkt mit dem iPhone als PDF ein. Qualität ist je nach Lichtverhältnissen ein wenig schlechter als mit nem Scanner, dafür spart man sich dieses Gerät.
 
Gehaltsabrechnungen dienen im Zweifelsfall als Nachweis für die Rente. Die würde ich behalten, oder du holst dir über die Rentenversicherung eine Aufstellung deiner Daten. Ich brauchte das für die Scheidung bezüglich Rentenansprüche. Daher konnte ich alle Gehaltsabrechnungen bis zur Scheidung vernichten. Ob man das als Privatperson auch beantragen kann oder ob das nur für Scheidungen gilt, weiß ich nicht. Meine Versicherung hat auf digital umgestellt daher habe ich da nichts mehr in Papierform. Alles andere wie Grundbuch, Baufinanzierungsunterlagen behalte ich als Original zusätzlich zur digitalen Kopie.
 
So eine Hardware wird im Privathaushalt nicht täglich verwendet, wie du selbst angemerkt hast.
Ein Kauf einer vernünftigen Hardware ist also keine Geldverschwendung.

Ich habe mir für zwischen 300-500 Euro einen ordentlichen "Duplex Dokumentenscanner mit OCR" gekauft.
  • Duplex, weil Dokumente nicht selten zwei beschriftete Seiten haben und die Hardware leere Seiten automatisch herausfiltern kann (spart viel Zeit!)
  • OCR, weil OCR nie schlecht ist... da muss man plötzlich etwas suchen (Fachbegriff, Betrag, Datum, Person, etc.), weiß aber nicht mehr genau wo es steht. Also einfach Strg+F und innerhalb weniger Sekunden finden. Und warum auch immer, aber mein Scanner hat eine geringere OCR Fehlerrate als Software-OCR Lösungen von PDF-Apps. (Acrobat Pro, PDF24, XChange, PDFelement, Nitro PDF)
  • Ordentlichen Dokumentenscanner, weil so ein Ding locker hunderte Seiten aufnehmen kann, welche man mit einem Knopfdruck selbst bei maximaler Qualität ein paar Stunden selbstständig laufen lassen kann.
Ich habe mir ganze Bücher, Skripte, etc. einfach eingelegt, den Start-Button gedrückt und das Ding scannen lassen, während ich einen Film angesehen habe. Nach dem Film habe ich weitere Seiten hinzugefügt, den Start-Button gedrückt und bin wieder weg.
So hat mein Gerät schon einige Male mehrere Stunden am Tag gearbeitet, was mich persönlich keine 15 Minuten gekostet hat (hunderte Seiten einlegen, Button drücken, hunderte Seiten herausnehmen, neue hunderte Seiten einlegen, Button, drücken, usw.)

Ich will mir gar nicht vorstellen, wie umständlich und vor allem wie viel (x hundertfach?) länger es gedauert hätte, jede einzelne Seite wie ein "Höhlenmensch" mit dem Smartphone abfotografieren zu müssen.
Oder jede einzelne Seite in so einen Mini-Scanner nachschieben zu müssen.

Klar, ich hätte wohl 300-500 Euro gespart, ABER dafür mit noch viel wertvollerer Lebenszeit dafür bezahlt, welche mit stupider Fließbandtätigkeit vergleichbar wäre, für die ich keinen Cent erhalten hätte.

Anfangs wollte ich am Schluss meinen Scanner wieder verkaufen. Da das Ding aber so praktisch ist, habe ich es doch behalten und noch viel mehr eingescannt, als ich vorhatte. (alte Unterlagen von Schule, Ausbildung, Studium, Weiterbildungen, Bücher, Rechnungen, Briefe, usw. )

Was ich physisch aufhebe:
  • wichtige Verträge (Immobilien, Bank, Auto, Versicherungen, etc.)
  • Zeugnisse, Zertifikate, Urkunden, etc.
  • Steuererklärungen
Dafür habe ich extra einen brandresistenten, wasserdichten und massiven Koffer gekauft.
 
Zuletzt bearbeitet von einem Moderator:
  • Gefällt mir
Reaktionen: sikarr
whigga schrieb:
Bevor ich das Vorhaben starte, wäre es für mich interessant zu wissen, welche Dokumente man am Ende im Original aufheben muss.
Heb alles auf, du musst deine Ablage nur sortieren falls du mal ins Papier musst. Ich weis nicht wie es bei den günstigen Geräten ist aber die Produktionsgeräte können beim Scannen eine Paginierung aufbringen, diese kannst du dann im Bild sehen und daran das Original identifizieren.
Oder du Stempels vorher alles Belege mit einer fortlaufenden Nummer durch, das geht auch, dann kannst du das alles schöne in Kartons schichten und schreibst nur von bis auf den Karton, wenn du dann was suchst hast du das Ruck zuck.

Warum aufheben? Wenn du kein Anständiges Backup hast ist alles weg, und so hättest du immer noch den Rückgriffmöglichkeit ins Papier, archivier es anständig und leg es in den Keller oder auf den Boden.
Auch akzeptiert nicht jede Behörde oder Gericht Scans, auch muss man aufpassen welchen Bildkompressionsalgoryhtmus man verwendet, JBIG wird z.B. nicht anerkannt weil schon zu viel damit schiefgegangen ist, man denke an das hier
whigga schrieb:
OCR - da ich kein DMS benutzen möchte, sollen die PDF-Dateien über die Suchfunktion im Betriebssystem auffindbar sein.
Immer mit OCR, die kostet nix selbst wenn die Erkennung Mist war, aber falls nicht ist es ein echter Mehrgewinn. Windows und Mac können über die Interne Indexierungsfunktinionen zugreifen, dauert am Anfang ein bisschen aber dann kannst du eine Rechnungsnummer in 5000 Dokumenten in Sekunden finden, ohne DMS.
whigga schrieb:
Hard-/Software: Wir sind zwei Privatpersonen. Nachdem der aktuelle Bestand digitalisiert wurde 8hierfür werde ich mir ein Gerät mit Dokumenteneinzug leihen), werden im Monat vielleicht 10 Seiten gescannt. Primär soll das ganze am Macbook stattfinden, weswegen ich ein kleines, handliches Gerät bevorzuge, welches per USB angeschlossen werden kann und darüber auch den Strom bezieht. Duplex möchte ich schon gerne haben,
Nimm einen anständigen Dokumentenscanner, diese Multifunktionsdinger sind für sowas nicht gemacht.
die haben so Sachen wie
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: kamanu
Moin würde es nicht ganz ohne Papierkram planen, es gibt handy stative/ kamera stative da legst das Dokument einfach drunter foto und gut.
reinen Text erkennt sogar mein huawei p20 und speichert des also on the fly ins txt/pdf format.
Papierlos eher nicht und optional halt als bonbon eben digital.

Muss der ganze datenmüll auch sicher sein, immer wieder die Archive auf Konsistenz prüfen usw. das Blatt papier im Ordner ist auch nach 100 Jahren lesbar, sofern es nicht abbrennt, dann ist das digitale medium alllerdings auch kaputt.
 
Zuletzt bearbeitet:
Ich werfe noch den Fujitsu scansnap in den Raum.
Verschiedene Geräte, super Software.
Habe privat und beruflich zwei verschiedene im Einsatz.
Einen ix1400 und einen alten ix100.
Bin sehr zufrieden.
 
Leude, vielen Dank für den ganzen Input. Einige haben sich hier echt viel Mühe gegeben, wirklich vielen Dank.

Leider seid ihr bisher aber nicht so konkret auf meine Fragen eingegangen, im Grunde bin ich genau so schlau, wie vorher auch :D

Für mich ist noch immer nicht ersichtlich, ob OCR jetzt von der Hard- oder Software übernommen wird. Ich weiß also nicht, ob ich jetzt beim Scanner-Kauf auf irgendetwas spezielles in die Richtung achten muss, oder nicht. Bzw. scheint es ja beides zu geben? Wie unterscheiden sich die beiden Varianten?

Bezüglich des Gerätes: Da ist mir die Kompaktheit tatsächlich mit am wichtigsten. Wie bereits im Ausgangspost erläutert, benötige ich kein Stationäres Gerät mit viel Schnickschnack. Wie gesagt: Ich bin eine Privatperson, es geht um Private Dokumente (Versicherungen, Krankenkasse, Strom-/DSL-Anbieter, Rechnungen für private Anschaffungen etc.). Da ist es vollkommen in Ordnung für mich, da einmal die Woche zwei DIN A4 Seiten einzulegen. Wichtig wäre mir da tatsächlich nur Duplex.

Welche Software brauche ich/ ist empfehlenswert? Bzw. brauche ich überhaupt eine spezielle Software? Was übernimmt die Software und was die Hardware?
 
Es ist immer eine Software die das OCR macht.
Selbst wenn das im tauglichen Scanner passiert, wird eine Software dazu benutzt.
Solch Art Geraete haben im Prinzip einen "Computer" in sich welcher OCR uebernimmt und das PDF danach irgendwo ablegt. Fuer die meisten tut es die Software auf dem PC oder das DMS.
 
Okay, also kann ich mir im Endeffekt den letzten Billo-Scanner holen, solange die Auflödung passt und die restlichen Eckdaten meinen Ansprüchen entsprechen?

Gibt es da Qualiätsunterschiede in der Software? Also kann es sein, dass Software A 100% des Textes erkennt, während es bei Software B lediglich 60% sind (Gleicher Scan als Ausgangsmaterial)?

Geschieht die Texterkennund direkt im Scan, oder ließe sich sowas auch nachträglich hinzufügen/ändern?
 
Das muss im Scan passieren, nachträglich ändern ist nicht.
Ansonsten wurden alle Deine Fragen bisher ausreichend beantwortet.
Vielleicht einmal die Antworten auch genauer lesen?

Dein Brother-Spielzeugscanner aus #1 kann schon mal kein Duplex und immer nur 1 Seite, möglichst nicht länger als Din A4. Gute separate Scansoftware kostet auch ihr Geld, wenn man mit der kostenlosen Geräte-Herstellersoftware nicht zufrieden ist.
Soweit ich die Beurteilungen des mobilen Brothers lese, ist da nicht viel Software dazu.
Das kannst Du auch bei Deinem HP-Multifunktionsgerät bleiben und einmal das herstellereigene HP-Scanprogramm ausprobieren. Vielleicht bietet das noch mehr Möglichkeiten als das windowseigene Scanprogramm.
 
whigga schrieb:
Für mich ist noch immer nicht ersichtlich, ob OCR jetzt von der Hard- oder Software übernommen wird.
Ist immer Software
whigga schrieb:
Welche Software brauche ich/ ist empfehlenswert? Bzw. brauche ich überhaupt eine spezielle Software? Was übernimmt die Software und was die Hardware?
Die Scanner haben meist passende dabei, bei Kodak ist es die Kodak Capture Pro Limited, die ist mehr als ausreichend, da fehlt eigentlich nur die Datenbankschnittstelle und ein paar Ausgabeformate für DMS Systeme aber ein PDF mit OCR geht immer.
whigga schrieb:
Gibt es da Qualiätsunterschiede in der Software? Also kann es sein, dass Software A 100% des Textes erkennt, während es bei Software B lediglich 60% sind (Gleicher Scan als Ausgangsmaterial)?
Das hängt an der Verwendeten OCR Engine, wie sie eingestellt ist, wie gut der Scan ist usw.
  • Du wirst nie 100% Erkennung haben, bei Handschrift wirds noch schlimmer.
  • SchwarzWeiß Bilder liefern die besten Ergebnisse
whigga schrieb:
Geschieht die Texterkennund direkt im Scan, oder ließe sich sowas auch nachträglich hinzufügen/ändern?
Wird immer nach dem Scan gemacht, wie gesagt es ist immer Software die das macht. OCR aus Scannern ist meist auch nicht so gut wie die Softwarelösungen da der Scanner nicht genug Zeit hat
OCR kann man auch nachträglich machen, gibt haufenweise Software die das kann auch das Editieren der Ergebnisse aber wer will das schon. Abbyy ist Marktführer bei OCR, die haben Richtig gutes Zeug, aber kostet auch. Dann gibts noch OmniPage von Nuance oder die Kostenfreihe Lösung Tesseract aber die ist sehr fummelig und wird nur über die Komandozeile bedient.
whigga schrieb:
Bezüglich des Gerätes: Da ist mir die Kompaktheit tatsächlich mit am wichtigsten. Wie bereits im Ausgangspost erläutert, benötige ich kein Stationäres Gerät mit viel Schnickschnack.
Ich hab dir ja ein paar Beispiel Geräte genannt, Schnickschnack gibts da generell nicht. Kodak hat z.B. eine sehr gut Binarisierung.
DuplexScan, DualStream, Autocroping, UDDS, PerfectPage ist kein Schnickschnack, das verhindert das du die Dokumente nochmal scannen musst oder nachbearbeiten.
Die Dokumentenscanner sind mehr als du von deinem "Kopierer" gewohnt bist, die sind schneller, zuverlässiger und haben bessere Software und liefern bessere Qualität. Kopierer oder Multifunktionsdrucker sind nicht für Durchsatz gebaut.
Ergänzung ()

ThomasK_7 schrieb:
Das muss im Scan passieren, nachträglich ändern ist nicht.
Das stimmt nicht, wie kommst du darauf?
 
Ich hab mir damals einen Brother All In One geholt, der druckt, scannt und kopiert und alles Duplex und im Stapel. Dabei ist eine Scansoftware, die beim Scannen oder nachträglich OCR macht. Alles easy und deutlich unter 500 €.
So was gibts auch von anderen Herstellern, auf jeden Fall finde ich es deutlich angenehmer, dass neben dem Drucker nicht auch noch ein extra Scanner rumsteht.
 
@sikarr

Erläutere mir bitte, wie Du nach dem Scan die Texterkennung bewerkstelligen willst!
 
Abbyy Finereader
Tesseract
Nuance Omniscan
Adobe Acrobat
Foxit Phantom
usw.

Das ist normales vorgehen. Für Unternehmen gibts sogar Software die ein Bild komprimieren, OCR machen und in ein PDF oder was auch immer packen. Und das mit mehren tausend Bildern die Stunde.

Texterkennung ist immer und jederzeit möglich. Selbst Irfan View kann das mit einem Plugin, der Markt für Software mit Texterkennung ist gigantisch. und da reden wir nur von OCR, es gibt auch noch ICR (Handschrift) und Fraktur usw.
 
Zuletzt bearbeitet:
Bitte im Detail erklären!
Mit welchem Format scanne ich ein, um es danach mit Texterkennung versehen zu können.
 
ThomasK_7 schrieb:
Mit welchem Format scanne ich ein, um es danach mit Texterkennung versehen zu können.
Jedes gängige Rasterbildformat ist möglich, gibt auch Exoten die noch mehr können. Selbst bei einer PDF lässt sich nachträglich eine OCR durchführen.
 
  • Gefällt mir
Reaktionen: ThomasK_7
ThomasK_7 schrieb:
Mit welchem Format scanne ich ein, um es danach mit Texterkennung versehen zu können.
Mein Nuance light (mit Drucker geliefert) kann auch nachträglich jedes pdf-Dokument mit OCR versehen, Scheint kein Hexenwerk zu sein.
 
Danke!
 
Zurück
Oben