Seite 1 von 1

PDF rearanger

Verfasst: Mittwoch 13. März 2019, 23:19
von AliSot2000
Hallo zusammen

Ich habe da schon länger ein Problem und zwar das folgende. Ich habe einen Drucker (HP Officejet Pro8620) mit Vorlageneinzug. Jedoch ist dieser Vorlageeinzug nur fähig einseitig zu Scannen. Also muss ich mit etwas beschiss immer alle Dokumente die zweiseitig sind gerade nach dem sie rausgekommen sind nochmal einfüttern, damit sie richtig eingescannt sind. Um dieses Problem zu lösen würde ich gerne ein Python Programm schreiben. Als in das Programm sollen zwei Dateien importiert werden. Eine mit den geraden Seitenzahlen, eine mit den ungeraden Seitenzahlen. Anschliessend soll das Program jeweils abwechselnd die Seiten zusammenfügen zu einem ganzen PDF Dokument.

Das wäre mal das erste Ziel.

Als weiteres Kriterium möchte ich gerne automatisch Seiten löschen können, wenn sie mehr als ein gewissen Prozentsatz weiss sind, also nicht beschrieben und nur der Vollständigkeit halber auch eingescannt wurden.

Ich habe schon etwas gesucht, wie man das wohl machen könnte, ich bin jedoch mit schon erhältlichen Programmen als Grundlage nicht weit gekommen. Dort muss man die Seiten von Hand rumschreien und dafür habe ich nicht die Zeit bei mehreren hundert Seiten.

Ich wäre euch sehr verbunden, wenn ihr mir dafür eine gute Library empfehlen könntet.

AliSot2000

Re: PDF rearanger

Verfasst: Donnerstag 14. März 2019, 08:19
von Sirius3
Es gibt pdftk das auf Kommandozeilen-Ebene PDFs zusammenfügen kann.
Zum Manipulieren von PDFs auf low-level-Ebene in Python gibt es PyPDF2 (Beispiel).
Für das Lesen von Bildern muß man dann schon die Interna von PDF kennen, da ist man mit einem externen Programm z.B. von xpdf besser dran.

Re: PDF rearanger

Verfasst: Donnerstag 14. März 2019, 12:11
von AliSot2000
Danke, ich werde mich mal ans Programmieren machen und bei weiteren Problemen dieses Forum erneut aufsuchen.