Seite 1 von 1

PDF trennen

Verfasst: Freitag 28. Februar 2020, 19:40
von reneschmidt
Hallo zusammen,

ich suche nach einer Möglichkeit PDFs mit mehren Seiten zu trennen.

Genauer gesagt: Es wir ein Stapel mit X Dokumenten gescannt dieser landet in einer PDF Datei und soll nun in die einzelnen Dokumente aufgeteilt werden.
Im Bereich Buchhaltung wird das z.B. häufig mit einem Barcodeaufkleber gemacht, der auf die erst Seite eines Dokuments geklebt wird. Ansonsten findet man häufig die Variante mit Trennblättern.

Vom Prozess kann ich theoretisch mit beiden Möglichkeiten leben.
Ich suche jetzt nach einer Möglichkeit diese Funktionalität in Python abzubilden.
Hat jemand eine Idee?

Re: PDF trennen

Verfasst: Freitag 28. Februar 2020, 19:46
von Sirius3
Google muß kaputt sein (Erster Treffer bei ›python pdf‹): https://realpython.com/pdf-python/

Re: PDF trennen

Verfasst: Freitag 28. Februar 2020, 19:56
von reneschmidt
Hi,

natürlich ist das reine Trennen nicht das Problem.
Mir geht es darum einen Weg zufinden die Dokumente anhand eines bestimmten Kriteriums (z.B. ein ausgeklebter Barcode) zu trennen.
Da hoffe ich, das mir jemand eine Tipp geben kann, ob es da etwas gibt.
Am schönsten wäre halt eine Lösung das PDF auf einen Barcode zu überprüfen und danach dann das ursprungspdf in die Einzelnen Dokumente zu zerlegen

Re: PDF trennen

Verfasst: Samstag 29. Februar 2020, 13:39
von paddie
Ohne es probiert zu haben... Sollte das doch mit OpenCV funktionieren. google mit opencv und barcode bringt auf jeden Fall schonmal ein paar Treffer. Wie weit die jetzt sinnvorll sind keine Ahnung ;-).