PDF lässt sich nicht durchsuchen

MP3-Hunter

Cadet 4th Year
Registriert
März 2003
Beiträge
72
HI,
ich habe ein 150 Seiten PDF Dokument, aus dem ich des öfteren Informationen brauche. Leider kann ich in dem PDF Dokument nicht suchen. Habt ihre eine Idee, was ich machen muss, damit ich in dem Dokument suchen kann? Ansonsten müsste ich das ganze Dokumet abtippen oder gibt es noch eine andere Lösung die Ihr für mich habt?

Danke
MfG HUnter
 
Hallo,

wie hast du denn die PDF erstellt?

Direkt aus Word heraus. Oder eingescannt?

Solltest du das Dokument eingescannt haben (Ohne Texterkennung)
sind die einzelnen Seiten nur "Bilder".
Und die kannst du halt nicht durchsuchen.

Wenn du das Dokument nicht als Word-Dokument bekommen kannst,
könntest du die Seiten ausdrucken und neu einscannen (mit Texterkennung).

Was anderes fällt mir sonst nicht ein.

Gruß,

Lasersword
 
Mir fallen auch nur die beiden möglichkeiten ein, aber:
So weit ich weiss kann man bei einem Texterkennungs-Programm auch andere Sachen als Quelle eingeben, nicht zwangsläufig den Scanner. Aber ob das mit 'nem PDF funktionieert wess ich nciht... Sorry
 
wenn die PDF auf Bitmaps (Grafik die Punkt für Punkt erstellt oder auch von einem Scanner eingelesen wurde) basiert, kannst Du die Daten auch nur Punktweise auslesen.

200 Punkte die den Buchstaben "A" oder "x" ergeben, lassen sich mit Programmen wie FineReader, OminPage oder auch kostenlosen - sogenannten - OCR Programme in "richtige" Buchstaben "übersetzen".

Um eine "gute Übersetzungsqualität" zu erreichen, muss die Vorlage in guter Qualität und hoher Auflösung vorliegen. Will heißen, wenn es Dir nicht immer leicht fällt die Inhalte des PDF zu lesen, dann kann auch das OCR-Programm nicht viel damit anfangen. Letztendlich zählt aber - probieren!

Blattwerk
 
damit habe ich nichts gemacht, die habe ich so bekommen
und das dokument ist klar und deutlich zu lesen
 
Heideldei!

Es geht nicht darum was Du gemacht oder nicht gemacht hast.

Es kommt darauf an, wie die PDF aufgebaut ist.

Angenommen - die Blätter des Dokumentes sind eingescannt, dann werden bei dem Scanvorgang nur einzelne Punkte eingelesen. Damit bestehen die Buchstaben nur aus einzelnen Grafikpunkten und deshalb kannst Du nicht, wie z.B. in Word, Buchstaben markieren und kopieren.

Damit sind die Daten in deinem Dokument keine Buchstaben und Sonderzeichen, sondern nur Millionen einzelner Punkte.

Informationen zum Scanner:

http://de.wikipedia.org/wiki/Scanner_(Datenerfassung)

Informationen zum Dokument = Bitmap - Pixelgrafik = aus einzelnen Punkten bestehende ...

http://de.wikipedia.org/wiki/Pixelgrafik



Nun zu dem Punkt den ich unter - Qualität - verstanden wissen wollte.

Wenn das Dokument aus Pixeln besteht und eine ausreichend hohe Qualität hat, kann man die PDF von einem Erkennungsprogramm (OCR) in Text umwandeln lassen. Dieses Programm übersetzt dann die Einzelpunkte - die wie ein Buchstaben aussehen - in einen Buchstaben mit dem der Computer arbeiten kann.

Diese Programme heißen FineReader, Omnipage ... oder das kostenlose Simple OCR*.


Bei den Herstellern der Programme, wird auch beschrieben was zu beachten ist und wie die die ganze Geschichte funktioniert.


Blattwerk


Link hierzu: http://www.simpleocr.com/?kSite=SW
 
Ist das Dokument vielleicht einfach geschützt, kannst du Text rauskopieren?
 
ich kann den text wohl makieren aber nicht kopieren
 
Dann hat der Ersteller der Datei - kopieren - verboten.

Über die Sicherheitseinstellungen lassen sich einige Funktionen, wie Drucken, Kopieren von Text und Grafik, Änderungen am Dokument ... verbieten.

Ich habe aber noch nie davon gehört, dass man die Suchfunktion blockieren kann.

Es ging doch aber um:

Leider kann ich in dem PDF Dokument nicht suchen. Habt ihre eine Idee, was ich machen muss, damit ich in dem Dokument suchen kann?

Dies kann ich mir nur dadurch erklären, dass es sich um Bitmap-Inhalte handelt.


Blattwerk
 
Welchen Reader benutzt Du?
 
Blattwerk schrieb:
Ich habe aber noch nie davon gehört, dass man die Suchfunktion blockieren kann.
Stimmt, da hast du wohl Recht.

Allerdings kann er ja Text auch markieren, also wird dieser schonmal als solcher erkannt.
 
Ich kann Text makieren.
Aber wenn ich ihn kopiere und woanders einfüge, dann kommt das dabei raus

" !

"

Leider wird es nicht richtig dargestellt, es sind nur Sonderzeichen oder Kästchen
 
Habe jetzt das Problem gehabt. Die Lösung bei mir ist, eine andere Schriftart (Standard) wie Arial zu nutzen. Er erkannte die Schriftart nicht und nahm es so womöglich als Bild wahr.
 
Zuletzt bearbeitet:
Nach 11 Jahren endlich die Lösung, Super gemacht. :volllol:
 
  • Gefällt mir
Reaktionen: Cardhu
Zurück
Oben