Hintergründe aus PDFs entfernen

Du hast eine Idee für ein Projekt?
Antworten
Herr Lehmann
User
Beiträge: 81
Registriert: Samstag 14. August 2010, 22:20

Hallo,

am Wochenende durfte ich mal wieder für meine Freundin ihre Medizin Scripte ausdrucken... Dabei handelt es sich zu 90% einfach um PPT-Folien die vom Prof ins PDF Format umgewandelt wurden (mit allen Hintergründe und Grafiken 1 zu 1 wie sie in der Präsentation existieren....

Ich habe mal eben eine Beispiel PDF generiert um zu veranschaulichen was ich meine:

http://www.snart.cc/testppt.pdf

Wenn ich 10 von diesen PDFs ausdrucke sind meine Patronen leer. Per Google habe ich nach einem Tool gesucht um die Hintergründe aus PDFs zu entfernen (+ Schrift invertieren falls weiß etc) Leider finde ich viele die ähnliche Probleme haben aber keine Lösung.

Meine Idee wäre nun so etwas mit Python zu realisieren.

Ich habe mich bisher kaum mit dem Format PDF beschäftigt und weiß nicht ob so etwas überhaupt mit Python möglich ist. Über Anregungen und Meinungen bin ich deshalb sehr dankbar.

Gruß

Christian
EyDu
User
Beiträge: 4881
Registriert: Donnerstag 20. Juli 2006, 23:06
Wohnort: Berlin

Ich würde einfach ein beliebiges PDF-to-Text-Tool benutzen. Hab auf die schnelle mal http://www.convertpdftotext.net/ getestet, die Ergebnisse sahen auf den ersten Blick gut aus. Ansonsten liefert Google noch hunderte weitere Alternativen.
Das Leben ist wie ein Tennisball.
Herr Lehmann
User
Beiträge: 81
Registriert: Samstag 14. August 2010, 22:20

Bei den PDF to Text Tools gehen leider auch Diagramme und Bilder verloren die sehr wohl erwünscht sind. Zumindest bei denen die ich getestet habt. Natürlich könnte man auch Acrobat verwenden um die PDFs zu editieren.. Aber die für die Kosten und den Aufwand kann man viele Druckerpatronen kaufen...
lunar

@Herr Lehmann: Für OpenOffice und LibreOffice gibt es eine Erweiterung, mit der man PDF-Dateien importieren und bearbeiten kann. Vielleicht hilft Dir das weiter. Ausprobiert habe ich das allerdings nicht, insbesondere weiß ich nicht, ob man das automatisieren kann.
Benutzeravatar
numerix
User
Beiträge: 2696
Registriert: Montag 11. Juni 2007, 15:09

lunar hat geschrieben:Für OpenOffice und LibreOffice gibt es eine Erweiterung, mit der man PDF-Dateien importieren und bearbeiten kann. Vielleicht hilft Dir das weiter. Ausprobiert habe ich das allerdings nicht, insbesondere weiß ich nicht, ob man das automatisieren kann.
Das war auch mein erster Gedanke und ich habe es gleich mit dem verlinkten Testdokument ausprobiert.
Import des Dokuments (in das Zeichenmodul) klappt einwandfrei. Aber: Zumindest bei dem Testdokument war es so, dass Hintergrund und Textfarbe nicht über Vorlagen festgelegt, sondern für jede Seite einzeln hart formatiert waren, so dass die Umwandlung ein lästiges Gefrickel ist. Vielleicht könnte man allerdings über OOO-Makros da etwas automatisieren. Das habe ich jedoch nicht ausprobiert.
Herr Lehmann
User
Beiträge: 81
Registriert: Samstag 14. August 2010, 22:20

schade, das es auf umwegen geht konnte ich mir schon vorstellen aber ich dachte einer von euch sähe eine automatisierbare lösung
Antworten