PDF zusammenfügen und dabei einzelne Seiten ersetzen

Du hast eine Idee für ein Projekt?
Antworten
Georgle
User
Beiträge: 3
Registriert: Montag 22. Juli 2024, 13:35

Hallo zusammen,

ich bin neu hier und fange an mich intensiver mit Python zu beschäftigen, da es auch sehr interessante Felder bei mir auf Arbeit gibt. Jetzt haben wir auch so ein Fall.

Wir möchten gern unsere Unterlagen digitalisieren. Leider haben wir den Fall, dass wir viele Großformate (größer A3) haben und diese nicht bei uns im Haus selbst scannen sondern von einem Dienstleister scannen lassen.

Pro Akte benötigen wir ein PDF. Jetzt ist es aber so, dass wir die Dokumentenformate A0 aussortieren und dem Dienstleister zur Verfügung stellen. Dieser Scan das Blatt und wir bekommen ein PDF pro Großformat von Ihm, welche nach einer vorgegebenen Nummer benannt ist. Den Rest der Akte würden wir selbst scannen. Somit hätten wir am ende des Tages, für eine Akten, zwei oder mehrere PDF-Dokumente. Diese möchte ich gern zusammenführen mit der Bedingung, dass das PDF mit dem A0-Format an der exakt gleichen Stelle ist, wie im original Papierform.
Ich habe mal gelesen, dass als "Platzhalter" für das rausgegebene Dokument ein Barcodeblatt (Strichcode) verwendet werden kann.

Ein Beispiel:

Eine Akte hat 10 Seiten:
Seite 1-4 = A4-Format (scannen wir selbst)
Seite 5 = A0-Format (geben wir dem DL)
Seite 6-9 = A4-Format (scannen wir selbst)
Seite 10 = A0-Format (geben wir dem DL)

Wir würden wie folgt scannen:
die Seiten 1-4, dann kommt der Platzhalter (Barcodeblatt 1), Seiten 6-9 und Platzhalter (Barcodeblatt 2). Das Dokument muss nach einer Nummer (z.B: 123456) benannten werden und wir haben das erste PDF.
Der DL scannt Seite 5 und Seite 10, als jeweils als ein PDF und wir bekommen vom DL zwei PDFs mit der Bezeichnung 123456_1 und 123456_2

Jetzt möchte ich gern automatisiert die Dokumente zusammenfügen und die Seiten ersetzen. D.h. aus drei PDFs wird eine mit der Bezeichnung 123456. Am Ende haben wir zwei Ordnern. In dem einen Ordner sind unsere gescannten PDF-Dokumente und im anderen Ordner sind die PDF-Dokumente des DL.

Sprich:

Seite 1-4
bei Seite 5 wird das Barcodeblatt 1 mit dem PDF 123456_1 ersetzt
Seite 6-9
bei Seite 10 wird das Barcodeblatt 2 mit dem PDF 123456_2 ersetzt

und heraus kommt ein neues, vollständiges PDF mit der Bezeichnung von uns 123456.

Das kann Python doch bestimmt automatisiert lösen oder? Ich habe schon verschiedene Videos mit der Problematik des Zusammenfügens von PDFs gesehen aber keines, wo gleichzeitig auch noch einzelne Dokumente ersetzt werden.

Ich hoffe der Sachverhalt ist soweit verständlich.

Über euren Rat bzw. für ein Python-Skript wäre ich sehr dankbar!
Sirius3
User
Beiträge: 18215
Registriert: Sonntag 21. Oktober 2012, 17:20

Für das Auseinandernehmen und neu Zusammensetzen von PDFs gibt es sicher einige Tutorials.
Einzige Schwierigkeit ist ja, von jeder einzelne Seite das Bild extrahieren, den Barcode zu entschlüsseln (z.B. https://pypi.org/project/pyzbar/) und dann das passende A0-PDF zu lesen und die Seiten dort einfügen.

https://pypdf2.readthedocs.io/en/3.0.0/ ... mages.html
https://pypdf2.readthedocs.io/en/3.0.0/ ... -pdfs.html
Georgle
User
Beiträge: 3
Registriert: Montag 22. Juli 2024, 13:35

Vielen Dank.

Lässt es sich besser lösen, wenn ich den gleichen Code vor dem A0-PDF setzte? Dann gibt es eine eindeutige Zuordnung und Python könnte in dem Haupt-PDF das Barcodeblatt mit A0 Plan ersetzen.
Benutzeravatar
ThomasL
User
Beiträge: 1377
Registriert: Montag 14. Mai 2018, 14:44
Wohnort: Kreis Unna NRW

Hi,
für mich stellt sich die Frage, wie viel Aufwand ist es dafür eine automatische Lösung selbst zu programmieren
im Vergleich dazu ein kostenloses Tool zu verwenden, mit dem man mehrere PDF zu einer PDF zusammen führen kann.
Ich muss das nicht 100x am Tag im Job oder privat machen und verwende wenn dann dafür PDFGear https://www.pdfgear.com/de/
Ich bin Pazifist und greife niemanden an, auch nicht mit Worten.
Für alle meine Code Beispiele gilt: "There is always a better way."
https://projecteuler.net/profile/Brotherluii.png
Georgle
User
Beiträge: 3
Registriert: Montag 22. Juli 2024, 13:35

Hallo,

vielen Dank. Die Tools sind mir schon bekannt und ja, man könnte es über solche Tools erledigen. Allerdings sind wir bei min. 3.000 bis 5.000 PDFs, die zusammengefügt werden müssen. Da wäre eine Automatisierung sehr Hilfreich.
Antworten