Maximale Auflösung Bildformate

Mr. Brooks

Lt. Commander
Registriert
Aug. 2011
Beiträge
1.441
Hallo,

ich erstelle gerade aus einigen Büchern, die ich als Screenshot (einen Screenshot pro Seite) erstellt habe, epub per Texterkennung. Im nicht jede Seite einzeln durch die Texterkennung zu jagen beschneide ich die ganzen Bildern erstmal mit XnViewMP auf den reinen Text. Ich schneide erstmal den Titel oben und die Seitenzahl unten weg und lasse das per Autp-Crop alles wegschneiden was "nicht Text" ist. Danach füge ich die so geschnittenen Bilder zu einem großen Bild zusammen. Die Einzelbilder liegen dann übereinander. Das jage ich durch die OCR-Software. Ich brauche nur einen Durchlauf und es werden auch Absätze zusammengefasst die eigentlich über 2 Bilddateien gehen.

Bisher waren es nur recht kurze Bücher, aber schon 17 Seiten erzeugen eine Hlhe von über 24000px. Wo liegt da die Grenze? Bisher hab ich nur mit JPG experimentiert. Die Datei aus 17 Seiten war 7MB groß.

Mr. Brooks
 
Wenn ich die entsprechende Wikipedia-Seite für JPEG2000 richtig deute (und die Informationen dort akkurat sind) gilt für das JPEG-Format eine maximale Größe von 64000x64000 Pixel.

https://de.wikipedia.org/wiki/JPEG_2000 (siehe: Vorteile gegenüber JPEG)

Allerdings gehe ich mal davon aus, daß dir je nach verwendeter Farbtiefe der Arbeitsspeicherbedarf Probleme bereitet. Bei der angenommenen Maximalgröße und 8 bit Farbtiefe wäre das ein Speicherbedarf von ca. 4 GB RAM. In deinem Fall dürfte der Vorteil sein, daß die Breite in Pixel gerechnet ja eher gering sein wird.

Letztlich wirst du wohl ausprobieren müssen was die OCR-Software noch verarbeiten kann.
 
Nvidia Ansel macht Screenshots in 61.440 × 34.560 (jpg)
Die sind dann auch gerne mal 30GB groß.
 
als alternative würde ich das pdf format benutzen, damit kannst du a) plattformübergreifend absichern, b) die dateigrösse angenehm klein halten, c) und eventuell bild in annehmbarer qualität mitkopieren. heutzutage kann fast jeder scanner direkt pdf mit ocr ausgeben. diverse gratis-pdf tools können auch ocr, direkt vom scanner
 
chrigu schrieb:
als alternative würde ich das pdf format benutzen

Der Grund wieso ich epub haben will ist die Lesbarkeit sowohl auf dem Tablet als auch auf dem Handy. Reiner Text wird an die Größe angepasst. PDF nicht.

Bei JPG ist in der Tat bei knapp 65000 Schluss. Damit die Dateigrößen nicht ausufern önnte ich PNG verwenden - bis das auch an seine Grenzen stößt. Aber 1000-seitige Bücher wollte ich eh nicht in einem Rutsch bearbeiten und die Seiten chrittweise zusammenfügen.
 
Zurück
Oben