Hallo,
am Wochenende durfte ich mal wieder für meine Freundin ihre Medizin Scripte ausdrucken... Dabei handelt es sich zu 90% einfach um PPT-Folien die vom Prof ins PDF Format umgewandelt wurden (mit allen Hintergründe und Grafiken 1 zu 1 wie sie in der Präsentation existieren....
Ich habe mal eben eine Beispiel PDF generiert um zu veranschaulichen was ich meine:
http://www.snart.cc/testppt.pdf
Wenn ich 10 von diesen PDFs ausdrucke sind meine Patronen leer. Per Google habe ich nach einem Tool gesucht um die Hintergründe aus PDFs zu entfernen (+ Schrift invertieren falls weiß etc) Leider finde ich viele die ähnliche Probleme haben aber keine Lösung.
Meine Idee wäre nun so etwas mit Python zu realisieren.
Ich habe mich bisher kaum mit dem Format PDF beschäftigt und weiß nicht ob so etwas überhaupt mit Python möglich ist. Über Anregungen und Meinungen bin ich deshalb sehr dankbar.
Gruß
Christian
Hintergründe aus PDFs entfernen
Ich würde einfach ein beliebiges PDF-to-Text-Tool benutzen. Hab auf die schnelle mal http://www.convertpdftotext.net/ getestet, die Ergebnisse sahen auf den ersten Blick gut aus. Ansonsten liefert Google noch hunderte weitere Alternativen.
Das Leben ist wie ein Tennisball.
-
- User
- Beiträge: 81
- Registriert: Samstag 14. August 2010, 22:20
Bei den PDF to Text Tools gehen leider auch Diagramme und Bilder verloren die sehr wohl erwünscht sind. Zumindest bei denen die ich getestet habt. Natürlich könnte man auch Acrobat verwenden um die PDFs zu editieren.. Aber die für die Kosten und den Aufwand kann man viele Druckerpatronen kaufen...
@Herr Lehmann: Für OpenOffice und LibreOffice gibt es eine Erweiterung, mit der man PDF-Dateien importieren und bearbeiten kann. Vielleicht hilft Dir das weiter. Ausprobiert habe ich das allerdings nicht, insbesondere weiß ich nicht, ob man das automatisieren kann.
Das war auch mein erster Gedanke und ich habe es gleich mit dem verlinkten Testdokument ausprobiert.lunar hat geschrieben:Für OpenOffice und LibreOffice gibt es eine Erweiterung, mit der man PDF-Dateien importieren und bearbeiten kann. Vielleicht hilft Dir das weiter. Ausprobiert habe ich das allerdings nicht, insbesondere weiß ich nicht, ob man das automatisieren kann.
Import des Dokuments (in das Zeichenmodul) klappt einwandfrei. Aber: Zumindest bei dem Testdokument war es so, dass Hintergrund und Textfarbe nicht über Vorlagen festgelegt, sondern für jede Seite einzeln hart formatiert waren, so dass die Umwandlung ein lästiges Gefrickel ist. Vielleicht könnte man allerdings über OOO-Makros da etwas automatisieren. Das habe ich jedoch nicht ausprobiert.
-
- User
- Beiträge: 81
- Registriert: Samstag 14. August 2010, 22:20
schade, das es auf umwegen geht konnte ich mir schon vorstellen aber ich dachte einer von euch sähe eine automatisierbare lösung