Dokumente auf PC indexieren - DMS oder "Desktop Suchmaschine"?

freaky2202

Cadet 2nd Year
Registriert
Aug. 2011
Beiträge
31
Liebe CBler,

mein Ziel ist es ein Programm zu finden was das gleiche leistet wie Spotify auf dem Mac:
Ordner X zu indizieren, (ggf. noch nicht "Text-PDFs" mit OCR zu durchsuchen, Optimal wäre es auch wenn er JPEgs mit OCR "lesbar" macht und einen Index aufbaut) und das Ergebnis auszuspucken.

Hier habe ich nur DMS wie das eloOffice gefunden, in das man aber tatsächlich Dateien "reinziehen" muss und verschlagworten soll/kann.
Dies ist aber nicht mein Ziel, ich möchte einfach einen Ordner "angeben", welcher bei meiner Suche berücksichtigt werden soll
und meine Dokumente nicht "ordnen".

Habe ich das Prinzip des Document Management Systems richtig verstanden (dient dem Ordnen)?
Ich möchte ja lediglich in meinen wilden Dokumenten was finden.
Wäre hier eher eine "Desktop Suchmaschine" wie Copernic was?
Da fehlt aber die OCR-Funktion, oder?

Vielen Dank für eure Tipps :)
 
Zuletzt bearbeitet:
Würde ich mich genötigt sehen Dokumente [so]wie PDFs oder gar JPGs nach Text filzen zu müssen wäre meine Frage an mich was ich mit dem Durcheinander soll und wo ich das her habe und warum ich das habe…
DMS = DMS und nicht DMS.

Technisch gesehen sollte das alles in einer Datenbank stehen.

CN8
 
Ich weiss woher ich das habe und wie es kommt - 1TB Daten nun neu zu Ordnen ist dennoch leider ein wenig schwierig.

Gibt es ein DMS (Paperport etc. sind ja auf Scanner zugeschnitten) welches die 1TB via OCR indexiert oder eine ähnliche Lösung die euch bekannt wäre?

Vielen Dank!
 
1. Versuch doch zunächst die Windows-Indexierung mit der Desktop-Suche.
2. Mit Paperport SE (ich meine das, was z. B. Brother besseren Scannern und AIOs mitliefert) kannst du auch nachträglich indexieren. Auch im Stapel (wenn in einem Verzeichnis) oder einzeln (dann aber über ganze Verzeichnisbäume).
Im Kombination mit Variante 1 kannst du den pdf-Professional Filter in Paperport aktivieren, was dazu führen sollte, dass pdf-Dateien nachträglich per OCR indexiert werden.
 
Danke Dir für Deinen konstruktiven Beitrag!
Habe OmniPage Ultimate in der Testversion, da wäre Paperport schon integriert; weisst Du evtl. wie das da geht? Habe schon ein wenig damir herumexperimentiert aber entweder habe ich etwas falsch gemacht oder zu viele Dateien, jedenfalls scheint der Indizierungsprozess bei 0% stehen zu bleiben, obwohl die Dateiliste/Verzeichnisbaum "abgerattert" wird.

LG und eine gute Woche!


EDIT: Werde nachher mal ein paar Screenshots/Schritte posten; in welchen man sieht wie ich (vlt. falsch) vorgegangen bin


EDIT2 AT halwe:
Damit ich das nicht missverstehe:
Indexiert der Filter erst bei der windows-Suche oder greift der auf den vorher erstellten Index von Paperport zurück?
Ergänzung ()

EDIT2 AT halwe:
Damit ich das nicht missverstehe:
Indexiert der Filter erst bei der windows-Suche oder greift der auf den vorher erstellten Index von Paperport zurück?
 
Zuletzt bearbeitet:
Ehrlich weis ich auch nicht 100%ig, wie die Windows Indexierung läuft.
Momentan ist bei mir beim Dateityp pdf der "PDF Professional Filter" eingestellt. Der stellt sich ein, wenn ich "Dateieigenschaften und -Inhalte indexieren" auswähle.
In Paperport habe ich aber kein Kreuz bei "PDF-Dateien mit der OCR-Funktion von PaperPort verarbeiten (PDF-Professional-Filter)". Ich nehme also an, dass meine (funktionierende) Indexierung auf der schon beim Scannen angewendeten OCR-Funktion basiert.
Bei meinem Brother AOI war Paperport SE Teil des Installationspaketes ...
 
Merci, probiere ich aus :) Vlt. krieg ichs mit OmniPage hin!
iFilter Finereader von ABby bietet auch einen Filter an, nur kann ich mir kaum vorstellen dass mangels Datenbank hier ein vorheriger Index erstellt wird...
 
Zurück
Oben