Software, die eine Liste erkennt und die Tabellenstriche selbst einzeichnet.

Sollten die vertikalen Linien stets an der gleichen Position sein, könntest du diese einfach 'drüber' drucken. Grundsätzlich bin ich auch der Meinung, dass dafür eine Anwendung programmiert werden muss. Zu speziell sind deine Anforderungen.
Überschlag doch mal, wieviel Zeit für diese Tätigkeit hochgerechnet im Jahr drauf geht, was diese in € wert ist und überleg dann mal, ab wann sich eine Eigenentwicklung rechnet.
 
Zuletzt bearbeitet:
Das mit der Berechnung ist eine sehr gute Idee. Das mit den Drucken um Ansatz auch, da die Linien tatsächlich immer an der gleichen Stelle sind. Leider ist der Einzug des Drucker und der Winkel der Seiten des Blattes zur Scannerplatte nicht immer komplett gleich. Das gibt leider zuviele Ungenauigkeiten, waas zur Folge hat, dass die Linien verschoben gedruckt werden und teilweise dann Wörter und Zahlen überdrucken.
 
Die senkrechten Linien sind gleich, aber die waagerechten doch nicht, oder? Bei den Maschinen stehen ja unterschiedlich viele Angaben.

Vielleicht kannst du dir eine Tabelle in einem Bildverarbeitungsprogramm malen und dann dieses jeweils über das gescannte Bild legen.
Dann hast du die senkrechten Linien und die waagerechten musst du dann eben noch verschieben/löschen/neu einfügen.
 
gäbe es da eine Möglichkeit diese selbst erstellte "Maske" dann auf ca 800 Seiten zu legen? Als Stapelvorgang sozusagen ? Das wäre interessant!
 
Wenn du die pdf per OCR digitalisierst, kriegst du ja die Tabellendaten als Text. Den kannst du mit einem Konverter in Excel oder txt konvertieren. Grundlage für die weiteren Überlegungen wäre also das, was da rauskommt, insbesondere hinsichtlich OCR-Qualität und Format der Textanordnung. Wenn du das hast und zumindest auszugsweise jemanden bereitstellen kannst, könnte man überlegen, auf welche Art und Weise man daraus eine saubere Excel- oder Word-Tabelle bekommt.
Viele Grüße, Halwe
 
Zurück
Oben