Buch-Textpassagen zügig digitalisieren

nutzerbename

Ensign
Registriert
Dez. 2018
Beiträge
175
Hallo allerseits,

wie digitalisiert ihr Textpassagen aus physischen Büchern?
Bei mir ist es oft so, dass ich Bücher lese (die es nicht als ebook gibt) und darin Textpassagen markiere (z.B. mit Leuchtstift), die ich dann digitalisieren möchte. - Um sie bspw. in word-Dokumenten oder später auch obsidian besser für mich nutzbar zu machen.

Als mögliche Lösungen sind mir eingefallen:
  • Mit Leuchtstift markieren -> Foto der ganzen Seite mit ocr -> chatgpt soll markierte Stellen extrahieren
  • Ganzes Buch erst durchlesen und mit Leuchtstift markieren -> markierte Stellen speech-to-text diktieren
  • Pen scanner wie scanmarker air/IRISpen. Man fährt damit über die Zeilen und es wird in ein digitales Dokument übertragen. Weiss nicht wie gut es tatsächlich funktioniert.

Vll. übersehe ich auch bessere Wege.
Wie würdet ihr das machen, um einen möglichst zeitsparenden Ablauf und gutes Ergebnis zu erreichen?
Vielen Dank schon mal für Tipps!
 
Mit Telefon die Passagen fotografieren und später eine OCR drüber. Gibt auch Apps die das gleich machen aka OfficeLens usw.
 
  • Gefällt mir
Reaktionen: adfsrg und nutzerbename
OCR kann Google Lens auch schon seit Ewigkeiten, also bei Android ist alles schon da. Nur halt nicht "automatisch alles aufschreiben, was ich bunt markiert habe".

Bei Apple bin ich raus, da muss wohl ne extra App sein. Oder man installiert Google Lens^. Gibt da aber nur Google, weiß nicht, was die App dann alles mit bringt.
Ergänzung ()

nutzerbename schrieb:
scanmarker air/IRISpen
Wenn du das viel machst, würde ich sowas versuchen. Erfahrungen hab ich da nicht.
Aber wenn du 100 Seiten hast, und auf jeder 2 Stellen markiert hast, dauert das mit scannen und raussuchen ewig.
Da ist mit dem Stift drüber fahren am schnellsten. Das sollte doch heutzutage auch eigentlich klappen, sogar Google Chrome kann Handschrift in PDFs lesen.
 
BFF schrieb:
Achso.
OfficeLens heisst ja MicrosoftLens.
... und wird im September eingestellt, weil "die Copilot-Apps das ja jetzt viel besser können".
 
  • Gefällt mir
Reaktionen: kartoffelpü und JumpingCat
Falls du das Buch nicht mehr in physischer Form benötigst:
  • Einband herausschneiden
  • hundert Seiten in einen Dokumentenscanner legen
  • Start drücken
  • x Minuten später die begradigte, gedrehte, mit OCR ergänzte Datei als ePub und/oder PDF speichern
 
  • Gefällt mir
Reaktionen: nutzerbename
Smily schrieb:
Bei Apple bin ich raus, da muss wohl ne extra App sein. Oder man installiert Google Lens^. Gibt da aber nur Google, weiß nicht, was die App dann alles mit bringt.
Ergänzung ()

Apple braucht für so etwas keine extra App.
Einfach mit der Originalen Kamera App darüber fahren über die Passage, unten auf dem Display auf Text klicken und schon ist er kopiert und lässt sich überall anders einfügen.
Schneller gehts nicht mitm Handy wie so.

Am besten woanders einfügen (Datei, OneNote,...) wo man mit dem PC sync.
 
  • Gefällt mir
Reaktionen: Smily
@Hochland Reiter
Sehr interessanter Ansatz, danke!

Paar Fraen dazu:
  • Welche OCR Software empfhielst du?
  • Wenn ichs dann als PDF/ePub vorliegen hab: Kann ichs dann mitm eReader wie Kindle lesen, Textpassagen markieren, markierte Textpassagen unkompliziert extrahieren nach word/obsidian, etc.?
 
@nutzerbename
Jeder Dokumentenscanner hat eine eigene Software, in der die OCR Funktion integriert ist.
ABER ich habe festgestellt, dass die Fehlerrate geringer ist, wenn ich ohne OCR scanne und die PDF über mein gekauftes PDF-XChange Pro nachträglich mit OCR durchsuchbar mache.
Ich habe allerdings einen sehr alten Dokumentenscanner von Canon! Ein modernes Gerät mit ggf. moderner Software und vielleicht anderer Marke könnte besser sein.

Wie ich dabei vorgehe, wenn mir das Buch wichtig ist:
  • mit einem Cuttermesser den Einband herausschneiden
  • Wichtig: Das Buch fest zusammenpressen (z.B. starke Papierpresse, günstige Papierpresse, 2x Schraubzwinge, etc.) (die Schraubzwingen reichen tatsächlich aus)
  • Buchrücken abschneiden (vorher am Rand markieren, wo der Text beginnt)
  • lose Seiten (je 50-150) in den Dokumentenscanner legen
  • Film gucken
  • lose Seiten (je 50-150) in den Dokumentenscanner legen
  • Film gucken
  • usw...
  • in der Software vor dem Speichern grob prüfen, ob alles gut aussieht (Seitenzahl übereinstimmt)
  • als PDF und/oder ePub speichern oder ggf. mit Calibre oder PDF-XChange nachbearbeiten (OCR oder Titelbild, Metadaten wie Autor, etc.)
Was du mit den PDF oder ePub machen kannst, hängt immer von deinem Gerät oder der Software ab. Also ja, mit einem Kindle wirst du auch lesen, markieren, etc. können.
Du musst aber damit rechnen, dass du Fehler durch OCR haben wirst, da es nicht perfekt ist. ~1% der Wörter könnten fehlerhaft sein. Manchmal wird aus einem "ö" ein "o" oder aus einem "i" ein "l".
Je höher die Qualität (dpi) des Scanners und je größer die Schrift, desto geringer die Fehlerrate, allerdings dauert es auch entsprechend länger.
Ich stelle immer die maximale Qualität ein und muss pro Blatt (beidseitiger Scan) ca. 30 oder 40 Sekunden warten.

Mit der geringsten Qualität zieht es die Blätter in 2 Sekunden durch. Das eignet sich für Briefe, Rechnungen, etc. die in Schriftgröße >10 und schwarz auf weiß gedruckt wurden. Bücher mit kleiner Schrift sollten mindestens mit 300 dpi, besser >400 dpi gescannt werden.

----

Das Abschneiden funktioniert mit einer kleinen Kreissäge am schnellsten und saubersten.
Perfekt wäre es natürlich durch eine industrielle Maschine, welche es presst und in einem Schnitt erledigt. Aber wer hat das schon?

Alternativ kannst du mit dem Cuttermesser jeweils 5-10 Seiten pro Schnitt trennen und immer in dieselbe Ritze tiefer schneiden. Das Ergebnis dabei wird sein, dass die Seiten etwas unsauber, rau und leicht schief geschnitten werden, was aber mit der integrierten Software kein Thema ist, weil diese die Seiten und die Schnittstelle begradigt und ggf. Lücken mit Farbe (schwarz, weiß, etc.) befüllt. Man wird aber sehen, dass da korrigiert wurde.
Was die Software nicht kann, aber PDF-XChange, ist jeder Seite an genau dieser Stelle einen rechteckigen Balken zu verpassen, welche diesen Effekt nochmals verringert. Eigentlich ist das aber völlig unnötig... zumindest mache ich es nie.

Dünne Bücher mit <200 Seiten schneide ich mit einem Cuttermesser. Das kostet ca. 5 Minuten, wenn es sauber sein soll. Dicke Schinken mit einer Kreissäge.

Falls du es mit einem Cuttermesser probieren willst, empfehle ich dringend an irgend einem unwichtigen Buch zu testen. Das erste Buch wird grauenhaft und schief geschnitten sein! Das braucht ein wenig Übung.
Ab dem Zweiten war es bei mir aber wirklich sauber.
Je weniger Kraft du einsetzt und je öfter du schneidest, desto besser wird das Ergebnis.

Gute Bücher loche ich anschließend und bewahre sie in einem A5 Ringordner auf.
Wenn man sich die Mühe macht, kann man sie auch wieder binden.

Zum rechtlichen Aspekt:
Solange du es nur für dich selbst machst, ist es legal.
Du darfst es natürlich nicht öffentlich teilen und schon gar nicht verkaufen.


P.S:
Es gibt auch Smartphone Apps, welche alle x Sekunden oder nach dem Umblättern ein Foto von zwei Seiten machen, es ausschneiden, begradigen es mit OCR speichern.
Meine Erfahrung damit (mit Premium Smartphones) ist, dass die alle total schlecht und das OCR extrem fehleranfällig ist. Außerdem habe ich keine Lust ewig zu sitzen und Seite für Seite umblättern zu müssen, als wäre ich zu einer Strafarbeit verdonnert worden.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: nutzerbename
Roesi schrieb:
unten auf dem Display auf Text klicken und schon ist er kopiert und lässt sich überall anders einfügen.
Oh, stimmt, gerade mit dem Firmen iPhone SE probiert. Das ist gut, danke!
 
  • Gefällt mir
Reaktionen: Roesi
@Hochland Reiter
Herzlichen Dank für die detaillierte, sehr gut verständliche Beschreibung Deiner Vorgehensweise!
Das reizt mich jetzt, es direkt mal mit nem (nicht so wichtigen) Buch auszuprobieren.

Hattest du Dir auch mal solche Buchscanner angesehen, wie von "CZUR"?
Klar, man muss ständig umblättern, aber geht wohl recht zügig das Scannen. Vorteil wäre nur, dass das Buch erhalten bleibt:
https://de.czur.com/products/etscanner
 
Zuletzt bearbeitet:
@nutzerbename
Nein, noch nie selbst gekauft oder getestet.
Vom Hören-Sagen, hauptsächlich aber von Reviews, soll die Kamera Qualität dieser Geräte höchstens mittelmäßig sein. Das ist mein Stand von ~2023... keine Ahnung wie es heute ist.

Ein modernes Smartphone soll bessere Fotos machen und damit auch die Fehlerrate von OCR reduzieren.
Dazu könnte man sich "Scan Stands" kaufen.
Ich selbst habe einfach eine alte flexible Tischhalterung für Smartphones genommen, das Buch mit einer Tischleuchte beleuchtet und es mit Microsoft Lens und vFlat getestet. vFlat war von der Bedienung ganz angenehm, aber nach ~30 mal umblättern oder so hatte ich keine Lust mehr. Die Qualität war beim Zoom auch sichtbar schlechter als von meinem Dokumentenscanner.

Lieber sammle ich meine Dokumente oder Bücher und scanne alles mit meinem Dokumentenscanner in einem Schwung, während ich einen Film ansehe.
Bei höchster Qualität ist der Scanner nicht nur langsamer, sondern auch sehr viel leiser. Und nebenbei muss ich nur alle 20-60 Minuten einen neuen Blätterstapel einlegen, wenn es viele Blätter sind.

---

Unwichtige Geschichte (& Anregung einen Dokumentenscanner zu kaufen):
Seitdem ich einen Dokumentenscanner habe, weiß ich, dass ich so ein Gerät mein Leben lang verwenden werde. Das ist eines der besten Geräte, um den Papierwahnsinn zu reduzieren und zu digitalisieren.
Ich habe vor ~6 Jahren ca. 300 € gezahlt und bereue es keinen Tag. Und in der Corona Zeit habe ich sämtliche Schul- und Ausbildungsunterlagen und Dokumente in meinem Leben, welche einen ganzen Schrank vollgestopft haben, auf eine kleine Box reduziert.
Mit manuellem Umblättern hätte ich es nie im Leben gemacht! Das waren bestimmte gute 50 kg Papier, welches nun auf einen kleinen USB-Stick passt und jederzeit in Sekunden mit OCR und Windows Suche durchsucht werden kann.
  • Ich will die Rechnung vom Dokumentenscanner? ~20 Sekunden: 290,68 €, Datum, Bestellnummer, usw.
  • Wann habe ich das erste Mal den Satz des Pythagoras gelernt? ~30 Sekunden: 6. Klasse, Name der Lehrerin, ungefähres Datum, etc.
  • Was habe ich in der ersten Ausbildungswoche gemacht? ~20 Sekunden: Berichtsheft gefunden... :D
 
  • Gefällt mir
Reaktionen: chillking, Roesi und nutzerbename
Zurück
Oben