PDF rearanger

Du hast eine Idee für ein Projekt?
Antworten
AliSot2000
User
Beiträge: 2
Registriert: Donnerstag 3. Januar 2019, 01:23

Hallo zusammen

Ich habe da schon länger ein Problem und zwar das folgende. Ich habe einen Drucker (HP Officejet Pro8620) mit Vorlageneinzug. Jedoch ist dieser Vorlageeinzug nur fähig einseitig zu Scannen. Also muss ich mit etwas beschiss immer alle Dokumente die zweiseitig sind gerade nach dem sie rausgekommen sind nochmal einfüttern, damit sie richtig eingescannt sind. Um dieses Problem zu lösen würde ich gerne ein Python Programm schreiben. Als in das Programm sollen zwei Dateien importiert werden. Eine mit den geraden Seitenzahlen, eine mit den ungeraden Seitenzahlen. Anschliessend soll das Program jeweils abwechselnd die Seiten zusammenfügen zu einem ganzen PDF Dokument.

Das wäre mal das erste Ziel.

Als weiteres Kriterium möchte ich gerne automatisch Seiten löschen können, wenn sie mehr als ein gewissen Prozentsatz weiss sind, also nicht beschrieben und nur der Vollständigkeit halber auch eingescannt wurden.

Ich habe schon etwas gesucht, wie man das wohl machen könnte, ich bin jedoch mit schon erhältlichen Programmen als Grundlage nicht weit gekommen. Dort muss man die Seiten von Hand rumschreien und dafür habe ich nicht die Zeit bei mehreren hundert Seiten.

Ich wäre euch sehr verbunden, wenn ihr mir dafür eine gute Library empfehlen könntet.

AliSot2000
Sirius3
User
Beiträge: 18051
Registriert: Sonntag 21. Oktober 2012, 17:20

Es gibt pdftk das auf Kommandozeilen-Ebene PDFs zusammenfügen kann.
Zum Manipulieren von PDFs auf low-level-Ebene in Python gibt es PyPDF2 (Beispiel).
Für das Lesen von Bildern muß man dann schon die Interna von PDF kennen, da ist man mit einem externen Programm z.B. von xpdf besser dran.
AliSot2000
User
Beiträge: 2
Registriert: Donnerstag 3. Januar 2019, 01:23

Danke, ich werde mich mal ans Programmieren machen und bei weiteren Problemen dieses Forum erneut aufsuchen.
Antworten