Dateigröße gescannter PDFs

iSeeSharp

Lt. Commander
Registriert
Jan. 2009
Beiträge
1.576
Moin Leute,

Ich durfte heute netterweise den Scanner auf der Arbeit nutzen um die erste Fuhre meiner Dokumente zu digitalisieren - ging super schnell und unkompliziert.

Eine Sache ist mir aber aufgefallen: die Dateigröße variiert zwischem 300 und 500kb pro Seite - mir kommt das etwas groß vor, oder ist das normal?

Meine Einstellungen:
300dpi
Farbe
Direkt als PDF mit OCR gescannt

Es handelt sich um einfache Gehaltsabrechnungen, also quasi keine Farbe, lediglich Text.

Klar, 2024 ist speicher generell kein Flaschenhals, allerdings läppert sich sowas mit der Zeit ja und ist im Bezug auf Cloud-Backups interessant
 
Ich finde die Dateigröße absolut als Standard.


Ich hab Anleitungen auf Arbeit, da sind 1000 Seiten drin, und das PDF ist ~20-40MB groß.
Ich vermute das hat was mit dem Export aus einer Anwendung bzw beim erstellen der Druckdaten ins PDF Format was damit zu tun. Bilder uä.

Dann gibt's Dokumente, die einfach gescannt sind, da liegt man mit 600DPI bei 4-5 MB, je nachdem
 
  • Gefällt mir
Reaktionen: BFF
Nö, ich finde die Größe vollkommen normal.
whigga schrieb:
Direkt als PDF mit OCR gescannt
Der Bildinhalt wird ja trotzdem noch in der PDF sein. Oder etwa nicht?
 
  • Gefällt mir
Reaktionen: G.O.Tuhls und BFF
redjack1000 schrieb:
Versuche es mal mit 200DPI und Schwarz/Weiss oder Graustufen.
Ach, alles gut. Die Qualität passt ja soweit, ich wollte nur wissen, ob die Dateigröße normal ist, oder ob ich da irgendetwas falsch eingestellt habe. Vielen Dank euch für die Antworten
 
Das ist schon iO so. Du kannst, auch ohne das Ausgangsmaterial zu kennen, auch noch mal runterdrehen. Adobe Acrobat zB brauch min. 72 dpi für text ocr. Aber sonst, passt schon :)
 
Brauchst du die 300 dpi für solche Dokumente wirklich? Mir reichen da 150 dpi auch aus. Über Graustufen kann man die Dateigröße bestimmt auch nochmal ordentlich verringern.
 
Ich hoffe du behältst die Originale. :D
Und wirf mal einen Blick auf die Scans und Dokumente ob die auch 1:1 identisch sind. ^^
 
  • Gefällt mir
Reaktionen: prh, Skudrinka, Radde und 3 andere
Diesen Bericht habe ich schon mehrmals gesehen, gerade eben wieder in voller Länge.
Einfach köstlich, wie man sich mit einfachen Zahlen einen schönen Abend machen kann.
 
  • Gefällt mir
Reaktionen: coxon und cartridge_case
An das Video von @coxon habe ich auch gedacht. Abgesehen vom krassen Fehler der Scanner ist der Vortrag auch ganz interessant wie scannen als PDF an sich funktioniert.
 
  • Gefällt mir
Reaktionen: coxon
coxon schrieb:
Ich hoffe du behältst die Originale. :D
Danke für den Vortrag.
Wirklich gut gemacht, krasse Story.
Hatte viel Spaß beim ansehen :)
 
  • Gefällt mir
Reaktionen: coxon
Dreihundert farbpixel pro Inch sind halt für „nur Text“ mit ocr recht viel. 150dpi würde reichen, was schon eine minimierung der dynamischen Grösse bedeutet. Je mehr Buchstaben, je mehr Bildinformation, desto grösser die Datei. Kommt noch ein Schatten der Buchmitte hinzu wird das als Bild interpretiert und damit auch mehr kb, auch ein logo oder handschriftliches wird als Bild implementiert
 
Zurück
Oben