Schattenkanzler
Ensign
- Registriert
- Dez. 2002
- Beiträge
- 184
Hi!
Also, ich habe zwar ca. 1000 Beiträge hier gefunden, die sich damit beschäftigen, wie man Texte und/oder Bilder aus einem PDF extrahiert (is ja nu nicht sooo schwer).
Ich habe allerdings das Problem, dass ich mehrere Tabellen inkl. Bildern und Text aus einem bzw. aus mehreren PDFs extrahieren muss/möchte.
Das ist nicht mehr so einfach...
Ich habe es mit PDF2HTMLGUI versucht, ebenso mit dem ganzen GhostScript - Zeugs, jedoch erhalte ich dabei nur die reinen Texte - und die reichen mir nicht.
Ich brauche die Struktur als <table> in HTML!
Kennt von euch jemand ein entsprechendes Tool? XPDF kann das glaub ich auch nicht.
Wäre wirklich sehr dankbar, wenn mir jemand helfen könnte!
Greets - SK
Also, ich habe zwar ca. 1000 Beiträge hier gefunden, die sich damit beschäftigen, wie man Texte und/oder Bilder aus einem PDF extrahiert (is ja nu nicht sooo schwer).
Ich habe allerdings das Problem, dass ich mehrere Tabellen inkl. Bildern und Text aus einem bzw. aus mehreren PDFs extrahieren muss/möchte.
Das ist nicht mehr so einfach...
Ich habe es mit PDF2HTMLGUI versucht, ebenso mit dem ganzen GhostScript - Zeugs, jedoch erhalte ich dabei nur die reinen Texte - und die reichen mir nicht.
Ich brauche die Struktur als <table> in HTML!
Kennt von euch jemand ein entsprechendes Tool? XPDF kann das glaub ich auch nicht.
Wäre wirklich sehr dankbar, wenn mir jemand helfen könnte!
Greets - SK