PDF Stapelverarbeitung: Splitten einer großen Zahl von PDFs in Einzelseiten

Stefan mit F

Ensign
Registriert
Dez. 2013
Beiträge
135
Guten Morgen,

ich besitze eine Sammlung von rund 6000 PDF-Dateien, verteilt auf über 100 Ordner, die jeweils zwei Einzelseiten (Hochformat, DinA4) haben. Ich benötige von jeder Datei nur die erste Seite, die zweite Seite soll gelöscht oder besser noch separat gespeichert werden.
Ich habe ein Ordnersystem mit Unterordnern, in denen sämtliche PDFs liegen, und hätte das Ordnersystem gerne dubliziert, wobei im einen System sämtliche PDFs ohne die jeweils erste Seite und im zweiten System sämtliche PDFs ohne die jeweils zweite Seite liegen.

Gibt es ein Programm, dem ich mitteilen kann, es möge in meiner Ordnerstruktur alle PDFs in allen Unterordnern suchen und aus jedem PDF die zweite Seite entfernen? Die PDFs sind jeweils nur 20-50KB groß (Gesamtgröße unter 200MB)

Es ist wohl verständlich, dass ein manuelles Splitten nicht infrage kommt. Wenn es ein Programm gäbe, das die PDFs Ordner-weise bearbeiten kann, wäre das schon mal eine Arbeitserleichterung, aber angesichts der über 100 Ordner immer noch sehr viel aufwändiger, als wenn das Programm sämtliche Ordner im Verzeichnis nach PDFs durchsuchen und jeweils die zweite Seite entfernen würde.

Eine mir zu aufwändige Lösung ist mir eingefallen: Ich binde die PDFs in jedem Unterordner jeweils zu einem PDF zusammen, teile es anschließend in gerade und ungerade Seiten, werfe die Datei mit den geraden Seiten weg und teile die Datei mit den ungeraden Seiten wieder in Einzelseiten. Arbeitszeit pro Unterordner: Geschätzt 2-3 Minuten. Das sind bei über 100 Ordnern 3-5 Stunden.

Die Dateien sind nur mit fortlaufenden Nummern, in jedem Unterordner jeweils beginnend bei 1, nummeriert. Daher ist es auch nicht möglich, sie alle in ein Verzeichnis zu kopieren (es sei denn, sie werden zuvor systematisch umbenannt).

Betriebssystem ist Windows 10, 64 Bit. Aktuell verwende ich die kostenlosen Programme PDFill und PDF SAM.
Da es sich um eine mehr order weniger einmalige Arbeit handelt (obgleich es sich mal wiederholen könnte) würde mir ggf. auch eine zeitlich beschränkte Demoversion eines Programms helfen (sofern die Anzahl der Aktionen nicht limitiert ist).

Vielen Dank im voraus für etwaige Tipps / Ideen.
 
Also das mit dem PDF splitten weiß ich zwar nicht aber ich hab eine Idee, wie du die PDFs alle auf einmal bearbeiten/zusammentragen kannst. Du gibst einfach im Hauptordner oben rechts in der Such-Leiste im Explorer "*.pdf" ein, dann zeigt er dir alle PDF Dateien in allen Unterverzeichnissen an. Da kannst du sie direkt verschieben/kopieren/bearbeiten oder was auch immer du damit machen musst. Musst also nicht alle Ordner einzeln auf machen um die Dateien einzeln zusammenzutragen.
 
Moin,
Switcheroo schrieb:
Du gibst einfach im Hauptordner oben rechts in der Such-Leiste im Explorer "*.pdf" ein, dann zeigt er dir alle PDF Dateien in allen Unterverzeichnissen an.
das Problem ist, dass die Dateien alle identische benannt sind: Die erste Datei in jedem Ordner heißt "1", die zweite heißt "2" und so weiter.
Sämtliche ~6000 Dateien zuvor zu einem großen PDF zusammenfügen löst mein Problem wohl nicht, da dabei meine (notwendige) Ordnerstruktur verloren geht.
Harry_Franken schrieb:
Der PDF24 Creator kann auch keine Stapelverarbeitung, oder?

Wie ich 100 oder mehr PDFs im selben Ordner zu einem einzigen verbinde, dann die geraden Seiten lösche und anschließend das verbleibende PDF in Einzelseiten zerlege, weiß ich.

Mein Problem ist die zu erhaltende Ordnerstruktur mit über 100 Unterordnern.
 
Mit Irfanview und seiner Batchkonvertierung ging es. Es kann aber keine PDFs speichern. Nur Bilder. Wäre aber auch eine Möglichkeit. Wenn gewünscht, dann halt die Bilder nachher wieder in PDFs umwandeln.
 
Foxit Reader und ne Batch ;p

wer damit (PowerShell) umgehen kann: da gibt es nichts was sich nicht damit machen lässt ;p Musst halt ein bisschen mehr als nur Klickibunti Mausschubser sein. Windows bringt eigentlich alles mit, man muss es nur nutzen!
 
Zuletzt bearbeitet:
Linux booten, rekursives shell script mit pdftk schreiben. Sollte in eim paar Minuten zu schaffen sein.
Für Windows fallen mir auch nur so Krücken ein.
 
Ich würde das glaub auch mit einer Linux LiveCD machen. Mit find findest du alle PDFs und mit pdftk kannst du die Seiten entfernen die du nicht brauchst. Das Script ist ein Einzeiler und definitiv in ein paar Minuten zusammen geklickt (auch wenn man sich in der Linux Shell nicht heimisch fühlt, stackoverflow hilft!).

@owned_you wie du das mit Powershell machst würde mich interessieren. Dir kann ja nur suchen aber prinzipiell mit den gefundenen Sachen nichts weiter machen. Kann man mit Powershell Ausgaben auch ala Linux an andere Programme zur Weiterverarbeitung pipen?
 
Neben den hier genannten Lösungen, bietet auch Adobe Acrobat (Professional, nicht der Reader) einen Aktionsassistenten an. Dieser bietet einige Möglichkeiten. Vllt hast du ja irgendwie Zugriff auf dieses Programm?
In Photoshop gibt es übrigens die Stapelverarbeitung, damit könnte es auch gehen.

Beide können alle Dateien eines Ordners verarbeiten, Unterordner eingeschlossen.
Wie das Speichern der neuen PDFs erfolgt, müsstest du testen.
 
Vielen Dank für die Tipps!

Irfan View habe ich auch und ich habe die Stapelverarbeitung dort schon genutzt, aber es scheidet aus, da ich dafür die pdf's erst alle in Bilddateien konvertieren müsste. Das geht ebenso schnell (bzw. langsam), wie die Dateien mit PDF SAM zu zerteilen.

Lösungen per Shell klingen interessant, allerdings habe ich mit Linux bisher keine Erfahrung und die Pseude-Shell unter Windows scheint wohl nur für Dateisortierungsverfahren geeignet zu sein? Ich werde mich da mal einarbeiten, wenn ich Zeit habe (entweder per CD oder auf einer extra Partition), aber es löst mein momentanes Problem nicht.

Andere Idee: Kann ich es einrichten, dass sämtliche PDFs in allen Unterordnern zusätzlich zu ihrem Dateinamen (der besteht nur aus 1-2 Ziffern) den Ordnernamen in den Dateinamen integriert bekommen?
Also: Aus Datei "1" in Ordner "ABC" wird Datei "ABC_1", aus Datei "3" in Ordner "EFG" wird Datei "EFG_3".

Dann hätten die 6000 Dateien zumindest mal unterscheidbare und eindeutig zuzuordnende Dateinamen und ich könnte die Dateien mit wenigen Klicks in einem Ordner zusammenführen, dort gebündelt bearbeiten (das geht recht fix) und anschließend (wie?) wieder entsprechend den Dateinamen (Datei "ABC_1" in Ordner "ABC" usw.) in die Ordner zurücksortieren.

Geht das unter Windows? Oder kann das Linux?

Wenn ich Dateien stapelweise über Ordnergrenzen hinweg umbenennen und umsortieren kann, würde das mein Problem auch lösen, ohne dass es Stückwerk wäre.

Vielen Dank nochmal im voraus.
 
Zurück
Oben