PDF zusammenfügen und dabei einzelne Seiten ersetzen
Verfasst: Montag 22. Juli 2024, 14:20
Hallo zusammen,
ich bin neu hier und fange an mich intensiver mit Python zu beschäftigen, da es auch sehr interessante Felder bei mir auf Arbeit gibt. Jetzt haben wir auch so ein Fall.
Wir möchten gern unsere Unterlagen digitalisieren. Leider haben wir den Fall, dass wir viele Großformate (größer A3) haben und diese nicht bei uns im Haus selbst scannen sondern von einem Dienstleister scannen lassen.
Pro Akte benötigen wir ein PDF. Jetzt ist es aber so, dass wir die Dokumentenformate A0 aussortieren und dem Dienstleister zur Verfügung stellen. Dieser Scan das Blatt und wir bekommen ein PDF pro Großformat von Ihm, welche nach einer vorgegebenen Nummer benannt ist. Den Rest der Akte würden wir selbst scannen. Somit hätten wir am ende des Tages, für eine Akten, zwei oder mehrere PDF-Dokumente. Diese möchte ich gern zusammenführen mit der Bedingung, dass das PDF mit dem A0-Format an der exakt gleichen Stelle ist, wie im original Papierform.
Ich habe mal gelesen, dass als "Platzhalter" für das rausgegebene Dokument ein Barcodeblatt (Strichcode) verwendet werden kann.
Ein Beispiel:
Eine Akte hat 10 Seiten:
Seite 1-4 = A4-Format (scannen wir selbst)
Seite 5 = A0-Format (geben wir dem DL)
Seite 6-9 = A4-Format (scannen wir selbst)
Seite 10 = A0-Format (geben wir dem DL)
Wir würden wie folgt scannen:
die Seiten 1-4, dann kommt der Platzhalter (Barcodeblatt 1), Seiten 6-9 und Platzhalter (Barcodeblatt 2). Das Dokument muss nach einer Nummer (z.B: 123456) benannten werden und wir haben das erste PDF.
Der DL scannt Seite 5 und Seite 10, als jeweils als ein PDF und wir bekommen vom DL zwei PDFs mit der Bezeichnung 123456_1 und 123456_2
Jetzt möchte ich gern automatisiert die Dokumente zusammenfügen und die Seiten ersetzen. D.h. aus drei PDFs wird eine mit der Bezeichnung 123456. Am Ende haben wir zwei Ordnern. In dem einen Ordner sind unsere gescannten PDF-Dokumente und im anderen Ordner sind die PDF-Dokumente des DL.
Sprich:
Seite 1-4
bei Seite 5 wird das Barcodeblatt 1 mit dem PDF 123456_1 ersetzt
Seite 6-9
bei Seite 10 wird das Barcodeblatt 2 mit dem PDF 123456_2 ersetzt
und heraus kommt ein neues, vollständiges PDF mit der Bezeichnung von uns 123456.
Das kann Python doch bestimmt automatisiert lösen oder? Ich habe schon verschiedene Videos mit der Problematik des Zusammenfügens von PDFs gesehen aber keines, wo gleichzeitig auch noch einzelne Dokumente ersetzt werden.
Ich hoffe der Sachverhalt ist soweit verständlich.
Über euren Rat bzw. für ein Python-Skript wäre ich sehr dankbar!
ich bin neu hier und fange an mich intensiver mit Python zu beschäftigen, da es auch sehr interessante Felder bei mir auf Arbeit gibt. Jetzt haben wir auch so ein Fall.
Wir möchten gern unsere Unterlagen digitalisieren. Leider haben wir den Fall, dass wir viele Großformate (größer A3) haben und diese nicht bei uns im Haus selbst scannen sondern von einem Dienstleister scannen lassen.
Pro Akte benötigen wir ein PDF. Jetzt ist es aber so, dass wir die Dokumentenformate A0 aussortieren und dem Dienstleister zur Verfügung stellen. Dieser Scan das Blatt und wir bekommen ein PDF pro Großformat von Ihm, welche nach einer vorgegebenen Nummer benannt ist. Den Rest der Akte würden wir selbst scannen. Somit hätten wir am ende des Tages, für eine Akten, zwei oder mehrere PDF-Dokumente. Diese möchte ich gern zusammenführen mit der Bedingung, dass das PDF mit dem A0-Format an der exakt gleichen Stelle ist, wie im original Papierform.
Ich habe mal gelesen, dass als "Platzhalter" für das rausgegebene Dokument ein Barcodeblatt (Strichcode) verwendet werden kann.
Ein Beispiel:
Eine Akte hat 10 Seiten:
Seite 1-4 = A4-Format (scannen wir selbst)
Seite 5 = A0-Format (geben wir dem DL)
Seite 6-9 = A4-Format (scannen wir selbst)
Seite 10 = A0-Format (geben wir dem DL)
Wir würden wie folgt scannen:
die Seiten 1-4, dann kommt der Platzhalter (Barcodeblatt 1), Seiten 6-9 und Platzhalter (Barcodeblatt 2). Das Dokument muss nach einer Nummer (z.B: 123456) benannten werden und wir haben das erste PDF.
Der DL scannt Seite 5 und Seite 10, als jeweils als ein PDF und wir bekommen vom DL zwei PDFs mit der Bezeichnung 123456_1 und 123456_2
Jetzt möchte ich gern automatisiert die Dokumente zusammenfügen und die Seiten ersetzen. D.h. aus drei PDFs wird eine mit der Bezeichnung 123456. Am Ende haben wir zwei Ordnern. In dem einen Ordner sind unsere gescannten PDF-Dokumente und im anderen Ordner sind die PDF-Dokumente des DL.
Sprich:
Seite 1-4
bei Seite 5 wird das Barcodeblatt 1 mit dem PDF 123456_1 ersetzt
Seite 6-9
bei Seite 10 wird das Barcodeblatt 2 mit dem PDF 123456_2 ersetzt
und heraus kommt ein neues, vollständiges PDF mit der Bezeichnung von uns 123456.
Das kann Python doch bestimmt automatisiert lösen oder? Ich habe schon verschiedene Videos mit der Problematik des Zusammenfügens von PDFs gesehen aber keines, wo gleichzeitig auch noch einzelne Dokumente ersetzt werden.
Ich hoffe der Sachverhalt ist soweit verständlich.
Über euren Rat bzw. für ein Python-Skript wäre ich sehr dankbar!