[Suche] PDF --> HTML

Registriert
Dez. 2002
Beiträge
184
Hi!

Also, ich habe zwar ca. 1000 Beiträge hier gefunden, die sich damit beschäftigen, wie man Texte und/oder Bilder aus einem PDF extrahiert (is ja nu nicht sooo schwer).

Ich habe allerdings das Problem, dass ich mehrere Tabellen inkl. Bildern und Text aus einem bzw. aus mehreren PDFs extrahieren muss/möchte.

Das ist nicht mehr so einfach...

Ich habe es mit PDF2HTMLGUI versucht, ebenso mit dem ganzen GhostScript - Zeugs, jedoch erhalte ich dabei nur die reinen Texte - und die reichen mir nicht.
Ich brauche die Struktur als <table> in HTML!

Kennt von euch jemand ein entsprechendes Tool? XPDF kann das glaub ich auch nicht.

Wäre wirklich sehr dankbar, wenn mir jemand helfen könnte!

Greets - SK
 
Den ersten und den letzten Link kannte ich leider schon. Das Ding da in der Mitte war ziemlich enttäuschend.

Aber es lieferte immerhin ein Ergebnis. Blöderweise hab ich das mit einem der von mir bereits angesprochenen Tools schon mal so hinbekommen!

Danke trotzdem!

Greets - SK
 
Zurück
Oben