Hallo zusammen,
ich bin neu hier und fange an mich intensiver mit Python zu beschäftigen, da es auch sehr interessante Felder bei mir auf Arbeit gibt. Jetzt haben wir auch so ein Fall.
Wir möchten gern unsere Unterlagen digitalisieren. Leider haben wir den Fall, dass wir viele Großformate (größer A3) haben und diese nicht bei uns im Haus selbst scannen sondern von einem Dienstleister scannen lassen.
Pro Akte benötigen wir ein PDF. Jetzt ist es aber so, dass wir die Dokumentenformate A0 aussortieren und dem Dienstleister zur Verfügung stellen. Dieser Scan das Blatt und wir bekommen ein PDF pro Großformat von Ihm, welche nach einer vorgegebenen Nummer benannt ist. Den Rest der Akte würden wir selbst scannen. Somit hätten wir am ende des Tages, für eine Akten, zwei oder mehrere PDF-Dokumente. Diese möchte ich gern zusammenführen mit der Bedingung, dass das PDF mit dem A0-Format an der exakt gleichen Stelle ist, wie im original Papierform.
Ich habe mal gelesen, dass als "Platzhalter" für das rausgegebene Dokument ein Barcodeblatt (Strichcode) verwendet werden kann.
Ein Beispiel:
Eine Akte hat 10 Seiten:
Seite 1-4 = A4-Format (scannen wir selbst)
Seite 5 = A0-Format (geben wir dem DL)
Seite 6-9 = A4-Format (scannen wir selbst)
Seite 10 = A0-Format (geben wir dem DL)
Wir würden wie folgt scannen:
die Seiten 1-4, dann kommt der Platzhalter (Barcodeblatt 1), Seiten 6-9 und Platzhalter (Barcodeblatt 2). Das Dokument muss nach einer Nummer (z.B: 123456) benannten werden und wir haben das erste PDF.
Der DL scannt Seite 5 und Seite 10, als jeweils als ein PDF und wir bekommen vom DL zwei PDFs mit der Bezeichnung 123456_1 und 123456_2
Jetzt möchte ich gern automatisiert die Dokumente zusammenfügen und die Seiten ersetzen. D.h. aus drei PDFs wird eine mit der Bezeichnung 123456. Am Ende haben wir zwei Ordnern. In dem einen Ordner sind unsere gescannten PDF-Dokumente und im anderen Ordner sind die PDF-Dokumente des DL.
Sprich:
Seite 1-4
bei Seite 5 wird das Barcodeblatt 1 mit dem PDF 123456_1 ersetzt
Seite 6-9
bei Seite 10 wird das Barcodeblatt 2 mit dem PDF 123456_2 ersetzt
und heraus kommt ein neues, vollständiges PDF mit der Bezeichnung von uns 123456.
Das kann Python doch bestimmt automatisiert lösen oder? Ich habe schon verschiedene Videos mit der Problematik des Zusammenfügens von PDFs gesehen aber keines, wo gleichzeitig auch noch einzelne Dokumente ersetzt werden.
Ich hoffe der Sachverhalt ist soweit verständlich.
Über euren Rat bzw. für ein Python-Skript wäre ich sehr dankbar!
PDF zusammenfügen und dabei einzelne Seiten ersetzen
Für das Auseinandernehmen und neu Zusammensetzen von PDFs gibt es sicher einige Tutorials.
Einzige Schwierigkeit ist ja, von jeder einzelne Seite das Bild extrahieren, den Barcode zu entschlüsseln (z.B. https://pypi.org/project/pyzbar/) und dann das passende A0-PDF zu lesen und die Seiten dort einfügen.
https://pypdf2.readthedocs.io/en/3.0.0/ ... mages.html
https://pypdf2.readthedocs.io/en/3.0.0/ ... -pdfs.html
Einzige Schwierigkeit ist ja, von jeder einzelne Seite das Bild extrahieren, den Barcode zu entschlüsseln (z.B. https://pypi.org/project/pyzbar/) und dann das passende A0-PDF zu lesen und die Seiten dort einfügen.
https://pypdf2.readthedocs.io/en/3.0.0/ ... mages.html
https://pypdf2.readthedocs.io/en/3.0.0/ ... -pdfs.html
Hi,
für mich stellt sich die Frage, wie viel Aufwand ist es dafür eine automatische Lösung selbst zu programmieren
im Vergleich dazu ein kostenloses Tool zu verwenden, mit dem man mehrere PDF zu einer PDF zusammen führen kann.
Ich muss das nicht 100x am Tag im Job oder privat machen und verwende wenn dann dafür PDFGear https://www.pdfgear.com/de/
für mich stellt sich die Frage, wie viel Aufwand ist es dafür eine automatische Lösung selbst zu programmieren
im Vergleich dazu ein kostenloses Tool zu verwenden, mit dem man mehrere PDF zu einer PDF zusammen führen kann.
Ich muss das nicht 100x am Tag im Job oder privat machen und verwende wenn dann dafür PDFGear https://www.pdfgear.com/de/
Ich bin Pazifist und greife niemanden an, auch nicht mit Worten.
Für alle meine Code Beispiele gilt: "There is always a better way."
https://projecteuler.net/profile/Brotherluii.png
Für alle meine Code Beispiele gilt: "There is always a better way."
https://projecteuler.net/profile/Brotherluii.png
Hallo,
vielen Dank. Die Tools sind mir schon bekannt und ja, man könnte es über solche Tools erledigen. Allerdings sind wir bei min. 3.000 bis 5.000 PDFs, die zusammengefügt werden müssen. Da wäre eine Automatisierung sehr Hilfreich.
vielen Dank. Die Tools sind mir schon bekannt und ja, man könnte es über solche Tools erledigen. Allerdings sind wir bei min. 3.000 bis 5.000 PDFs, die zusammengefügt werden müssen. Da wäre eine Automatisierung sehr Hilfreich.