Hallo,
ich hoffe, ihr könnt mir weiterhelfen: Ich scanne häufiger Artikel aus Büchern ein, um sie als PDF auf dem Computer zu haben und weiter mit ihnen arbeiten zu können. Der Vorgang ist ziemlich umständlich und mich interessiert außerdem, wie ich die Qualität und die Dateigröße des entstandenden PDFs in ein gutes Verhältnis bekomme. Bisher ging ich immer so vor:
1. Alle Seiten als JPG einscannen, DPI: ca. 300.
2. Mit GIMP jedes Bild einzeln auf die Buchseite reduzieren, also sämtliche schwarzen Ränder wegschneiden.
3. Mit Irfanview und JPG-Kompression rumprobieren. Da es nur um Text geht, scheint mir sogar, ich kann die Qualität auf 10% stellen und ich bemerke keine großen Verluste.
4. Ein leeres OpenOffice-Textdokument erstellen, in dem ich auf jede Seite eines der JPG-Bilder lade und dieses vergrößere, dass es die ganze Seite bedeckt.
5. Mit OpenOffice das ganze als PDF abspeichern.
(6. Mit PDF XChange Viewer eine Texterkennung (OCR) darüberlaufen lassen.)
Das hat so weit auch immer funktioniert, ist eben nur eine umständliche Arbeit, bei der vieles von Hand getan werden muss. Außerdem bin ich mir sehr unsicher, was für die endgültige Qualität und Größe des PDFs am wichtigsten ist: Die DPI beim Scannen oder die JPG-Kompression? Oder ist nach dem Import in OpenOffice sowieso alles egal, weil die Bilder intern komprimiert werden? Bisher war es bei mir so, dass ca. 10 Buch-Doppelseiten ein ca. 6 MB großes PDF ergeben.
Ich bin bei Google nicht auf Anhieb fündig geworden, wie man solche Sachen professionell (aber dennoch nur mit Freeware) erledigt, vor allem wenn es um lange Abschnitte aus Büchern bzw. viele Artikel handelt.
Danke für eure Hilfe oder Verweise auf weiterführende Informationen!
ich hoffe, ihr könnt mir weiterhelfen: Ich scanne häufiger Artikel aus Büchern ein, um sie als PDF auf dem Computer zu haben und weiter mit ihnen arbeiten zu können. Der Vorgang ist ziemlich umständlich und mich interessiert außerdem, wie ich die Qualität und die Dateigröße des entstandenden PDFs in ein gutes Verhältnis bekomme. Bisher ging ich immer so vor:
1. Alle Seiten als JPG einscannen, DPI: ca. 300.
2. Mit GIMP jedes Bild einzeln auf die Buchseite reduzieren, also sämtliche schwarzen Ränder wegschneiden.
3. Mit Irfanview und JPG-Kompression rumprobieren. Da es nur um Text geht, scheint mir sogar, ich kann die Qualität auf 10% stellen und ich bemerke keine großen Verluste.
4. Ein leeres OpenOffice-Textdokument erstellen, in dem ich auf jede Seite eines der JPG-Bilder lade und dieses vergrößere, dass es die ganze Seite bedeckt.
5. Mit OpenOffice das ganze als PDF abspeichern.
(6. Mit PDF XChange Viewer eine Texterkennung (OCR) darüberlaufen lassen.)
Das hat so weit auch immer funktioniert, ist eben nur eine umständliche Arbeit, bei der vieles von Hand getan werden muss. Außerdem bin ich mir sehr unsicher, was für die endgültige Qualität und Größe des PDFs am wichtigsten ist: Die DPI beim Scannen oder die JPG-Kompression? Oder ist nach dem Import in OpenOffice sowieso alles egal, weil die Bilder intern komprimiert werden? Bisher war es bei mir so, dass ca. 10 Buch-Doppelseiten ein ca. 6 MB großes PDF ergeben.
Ich bin bei Google nicht auf Anhieb fündig geworden, wie man solche Sachen professionell (aber dennoch nur mit Freeware) erledigt, vor allem wenn es um lange Abschnitte aus Büchern bzw. viele Artikel handelt.
Danke für eure Hilfe oder Verweise auf weiterführende Informationen!