Arbeitsgänge rund um PDF-Bearbeitung automatisieren

alles

Lt. Junior Grade
Registriert
Aug. 2004
Beiträge
286
Hallo allerseits,

was das Einscannen von Dokumenten angeht, vollführe ich die immerselben Arbeitsschritte, die ich angesichts der Häufigkeit so langsam satt habe. Daher würde ich mir in der Hinsicht den PC-Alltag etwas erleichtern wollen und gerne in Erfahrung bringen, ob man sich dafür was einrichten kann. Was ich so aufgeschnappt habe, denke ich da an ein Skript oder ein Tool!

Im Prinzip geht es um folgende Arbeitsgänge, die möglichst zusammengefasst und selbstständig ausgeführt werden sollten:
Nach dem Einscannen von Unterlagen über Dokumenteneinzug, sollen es im Adobe Acrobat bearbeitet werden. Dann normal abgespeichert werden. Wieder einige Einstellungen vorgenommen werden (u.a. die Eigenschaft Zweiseitenansicht mit Deckblatt) und (um es per Mail versenden zu können) als PDF in reduzierter Größe abgespeichert werden.

Hättet Ihr da eine Idee, wie ich mich dahingehend aushelfen kann? Bin für jeden effektiven Ansatz offen und bedanke mich vorab für jede Anregung!

Liebe Grüße,
alles
 
alles schrieb:
Nach dem Einscannen von Unterlagen über Dokumenteneinzug, sollen es im Adobe Acrobat bearbeitet werden. Dann normal abgespeichert werden.

Was soll bearbeitet werden? Liest sich auf den ersten Blick so, als würde das nicht jedesmal derselbe Arbeitsschritt sein. Dann lässt er sich auch nicht automatisieren.
 
Ganz im Gegenteil, es sind stets die selben Arbeitsschritte.
Es geht um das Zuschneiden, den ClearScan beim OCR und bei Bedarf um das Drehen und die Setzung eines Wasserzeichens!
 
Ok, es gibt die Möglichkeit den Acrobat über ein Skript fernzusteuern. Hast du Programmiererfahrung? Der erste Schritt wäre aber sicherlich den Arbeitsablauf ganz genau aufzustellen. D.h. Wann soll was passieren? Wie genau passiert es?

Danach schauen, ob die entsprechende Funktionen von ausserhalb zugänglich sind. http://help.adobe.com/en_US/acrobat...vApp_Architecture/IAC_DevApp_Architecture.htm

Ich habe sowas selbst noch nie gemacht. Google Suche nach Adobe Acrobat und Automatisierung bzw. Automation liefert aber einige Resultate.

Evtl. ist die Lösung auch ein Plug-In:
https://jungjuseong.gitbooks.io/acr...ding_which_acrobat_sdk_technology_to_use.html
 
Zuletzt bearbeitet:
Du kannst in Acrobat (also die Vollversion, NICHT den Reader) Batches anlegen. Das ist im Grunde genommen sowas wie "Nimm alle PDF aus Verzeichnis XY, richte sie aus, mache OCR-Erkennung und speichere Sie als PDF-x (wobei das X für den Typ des PDF-Dokuments steht, da gibt es ja so einige mittlerweile). Da brauch man weder für programmieren können noch sonst was für installieren. Du startest lediglich Acrobat, startest da dein Batch und gehst dir nen Kaffee holen und hältst einen Plausch mit der hübschen Sekretärin nebenan, je nach Größe/Menge der Dateien kann das dann nämlich noch einen Moment dauern.
 
Programmierkenntnisse sind keine vorhanden, allerdings geht es konkret um folgende Schritte.

1) Dokument mit 300 DPI einscannen über Acrobat mit benutzerdefinierten Einstellungen (beidseitig, benutzerdefinierte Seitengröße, ohne Komprimierung, Filter-Einstellungen).
2) Zwischenspeichern
3) Werkzeug "Scan verbessern" benutzen und Text erkennen mit ClearScan samt Neuberechnung auf 600 DPI.
4) Das Ergebnis bis dato abspeichern und eine Kopie auf eine andere Partition erstellen.
5) Nochmals abspeichern, aber diesmal als "PDF mit reduzierter Größe"
6) Acrobat schließen und ein anderes Programm öffnen, das das Dokument öffnet und danach die Eigenschaften und Metadaten des Dokuments entfernt.
7) Wieder abspeichern und das Programm schließen.
8) Wieder Acrobat öffnen und unter Eigenschaften das Seitenlayout bei "Absicht beim Öffnen" auf "Zweiseiten mit Deckblatt" umstellen.
9) Die erste Seite als Bild abspeichern, welches über Paint geöffnet werden soll, um es zu verkleinern.
10) PDF und Bild absoeichern. Acrobat und Paint schließen.

Also nachdem die Arbeitsschritte nicht nur auf Acrobat beruhen, wird es wohl über externe Tools, sei es eine BAT-Datei oder was auch immer, gehen müssen!

Sehr Ihr da eine Chance in der Umsetzung oder handelt es sich dabei um eine unrealistische Vorstellung und bleibt ein Traum?
 
AutoIt.
Primitiv die Mausklicks relativ zum Fenster abschicken, oder ggf. noch besser Tastenkombinationen einsetzen. Mit Warteintervallen dem Rechner Zeit geben zu reagieren (das Erkennen von Fenstern und Anwendungen hat auf keinem System geklappt…)
Nur musst du dazu ein wenig Programmierkenntnisse haben; wer VBA kennt kommt gut zurecht.

CN8
 
Ah, super, vielen, vielen Dank! genau das ist mir mal über den Weg gelaufen und der Name lag mir nur auf der Zunge.
Werde das bei Gelegenheit mal durchtesten (gibt auch Forum dafür!).
Dennoch bin ich für alternative Wege weiterhin offen!
 
Na ja, die direkte Alternative wäre die Skriptsprache AHK.

Eine ganz andere Alternative wäre folgende Überlegung:
1. Du erzeugst mit einem guten pdf-Scanner (mit meinem Brother Drucker kam das Control Center welches schon ganz gute pdfs (inklusive OVR) erzeugt), die deinen Vorstellungen ab Werk sehr nahe kommen (Zuschnitt, Auflösung, ...).
2. Du bereitest einen pdf-Drucker so vor, dass er die restlichen Merkmale (zusätzliche Komprimierung, Wasserzeichen) beinhaltet.
3. Dann ziehst du einfach die eingescannten Dokumente auf den pdf-Drucker mit den voreingestellten Merkmalen, was auch die persönlichen Eigenschaften entfernen dürfte.

Das Bedienen per Skript (AutoIt oder AHK) ist eine Alternative, wenn du das schon mal gemacht hast oder ohnehin schon lange mal wolltest. Ansonsten rechtfertigt es nicht den Aufwand, da die Fernsteuerung eines Programms damit (inkl. der Probleme beim Handling komplexer und speicherintensiver Dokumente) nicht einfach sein wird.

Viele Grüße, Halwe
 
Danke Halwe für Deine Anregungen!

Ja, es gibt die Möglichkeit, mit Voreinstellungen einen Scan-Auftrag loszuschicken. Doch sind diese nicht so umfassend, wie wenn man nach dem Scan diese manuell im Programm vornimmt. Unter Acrobat denke ich da zum Beispiel an die Einstellung für die Auflösung bei ClearScan. Bei dem Scan kann man diese Texterkennung zwar einstellen, aber nicht die Auflösung. Daher wird ohne OCR eingescannt und danach ClearScan mit einer frei wählbaren Auflösung angewendet.
Auch so ist das eingescannte Dokument in der Weise nachzubearbeiten, wie es vorher eben nicht möglich oder einstellbar ist, u.a. das Entfernen jeglicher Metadaten oder das Speichern als reduzierte Größe.

Kennt jemand übrigens eine gute Anleitung für AutoIt?
 
Aber das mit dem pdf-Drucker zur Entfernung persönlicher Merkmale und Komprimierung hast du verstanden?
Wenn das OCR beim Scan nicht optimal ist, könntest du einen alternativen Scannertreiber probieren.

Aus meiner Sicht ist das alles sinnvoller, als per Acrobat per Script zu steuern, weil es hier eben um große und speicherintensive Dokumente mit potentiell unerwarteten Bediensituationen handelt. Außerdem, das ist meine Erfahrung beim Steuern von Acrobat per Skript, musst du die Skripte ggf. bei jeder Acrobat Version umschreiben.

Bei AutoIt kann ich dir nicht helfen, nur bei AHK.

Viele Grüße, Halwe
 
Aaaah, verstehe...es erst jetzt, gaaanz lange Leitung ;-)
Welcher pdf-Drucker bewerkstelligt diese Kriterien denn?

Komprimierung mach ich ja über Acrobat, aber erst, wenn das Dokument so gut wie fertig bearbeitet wurde.
Das OCR im Acrobat ist optimal, aber nur, wenn man es nach einem Scan ohne OCR manuell einrichtet. Wenn man es nur vor dem Scan die Testerkennung setzt, ist es nur eine halbherzige Umsetzung!

Was meinst Du eigentlich mit alternative Scannertreiber? Habe jenes vom Hersteller und als Scanprogramm war ein verstaubtes PaperPort dabei. Habe mich dann an Finereader rangewagt, doch dessen OCR-Ergebnisse kommen nicht an jene von Acrobat ran!

AutoIt war ja nur ein Vorschlag. Wenn man mein Vorhaben mit AHK ebenso umsetzen kann, dann gerne.
Vielleicht kannst Du posten, wie die Umsetzung meiner Vorstellungen in Deinem Scan-Arbeitsumfeld aussehen würde. Dann könnte ich es eventuell auf mein System umsetzen.

Dieses "Control Center" Deines Brother-Scanners dürfte der "Button Manager" meines Gerätes entsprechen. Ich habe zwar keinen "Brother", aber der Hersteller kennt das Programm auch:
http://www.brother.at/support/glossar/scannen/button-manager-v2
 
Beim pdf-Drucker musst du schauen, welche du hast und welche dabei die Komprimierung ermöglichen. Bei mir ist ein Nuance Treiber drauf ("dokucom pdf Driver") wo ich die Komprimierung einstellen kann.
Ich glaube hinter meiner "ControlCenter" steckt auch Nuance Software, es spielt mit dem Paperport zusammen. Das OCR liefert brauchbare Ergebnisse im S/w Modus, ansonsten werden die Dateien tatsächlich sehr groß.

Mit AHK (und wohl auch mit AutoIt) kannst du (im einfachsten Fall) Programme starten (z. B pdf-Datei auf AHK-Skript ziehen) und dann Tastenfolgen senden und Fenster abwarten. Damit könntest z. B. beim Ziehen einer Datei auf das erstellte Skript automatisch Adobe mit dieser Datei starten lassen, warten bis das Anwendungsfenster da ist und dann Befehle auslösen. Der Syntax ist recht simpel.

Dabei nützt dir ein Skript aus meiner Umgebung allerdings wenig, du musst einfach einen Standard-Arbeitsablauf versuchen per Tasten auszulösen und genau diese Tasten dann in einen AHK-SEND-Befehl eintragen. Ich weiß eben nur nicht, ob Acrobat bei den Befehlen immer klare Ende-Situationen (aufpoppende Fenster, definierte Reaktionszeit) liefert, auf die du dann im Skript reagieren kannst.

Ansonsten, hinsichtlich der Komprimierung von pdfs habe ich auch mit dem Tool hier gute Erfahrungen gemacht, da kannst du Batch-Komprimieren.

Viele Grüße, Halwe
 
Zurück
Oben