Suche OCR PDF to PDF

itmonitor

Newbie
Registriert
Aug. 2021
Beiträge
2
Hallo,

Ich habe ein Privatbibliothek, das rund 3.000 PDF Datei hat. Rund 1.500 Datei sind schon mit OCR gescannt. Ich suche ein OCR Software für Windows 10, das der Funktion "skip OCRd" hat. Das ist, der Sotware erkennt und überspringt, die Datei das schon OCRd sind.

VG

IM
 
Was wäre (außer der Rechenzeit) denn der Nachteil, wenn die Software noch einmal die Dateien durchgeht?
Wenn der Text schon als Text erkannt und umgewandelt wurde ist es ja schon Text und kein Bildinhalt mehr, also für OCR bereits irrelevant.
 
  • Gefällt mir
Reaktionen: Tenferenzu und kernel panic
Danke. Ocrmypdf braucht Python, Tesseract uzw zu arbeiten. Gibt es ein Software, das unten Windows 10 unkompliziert installieren kann? Wir sind in 2021 Leute.
 
@harrysun Abgesehen, dass du recht hast, scheint die Software aber die Online Texterkennung von Google zu benutzen (zumindest laut dem Kommentar zu der Software bei heise Download)
Zum Thema: spontan habe ich den OCR-PDF Konverter entdeckt, kann aber scheinbar nicht mehrere PDFs auf einen Schlag umwandeln - muss der TE wohl selbst weiter googlen.
Ansosten ist es aber auch keine Kunst, die von @harrysun vorgeschlagene Software zu installieren, sofern die erwähnte Online Texterkennung von Google kein Problem darstellt.
Edit: der PDF24Creator kann scheinbar auch OCR und mehrere auf einen Schlag
 
harrysun schrieb:
Ist das ein Fall von "Let Me Google That For You"
Leider nicht. Google spuckt bei mir die Seite nicht aus. Immerhin war die Installation schnell erledigt und das Dokument nun suchbar! Danke! ;)
 
Zurück
Oben