Bearbeiten von PDF-Dateien mit Software möglich?

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
schneehase
User
Beiträge: 2
Registriert: Sonntag 23. April 2017, 18:38

Guten Abend,

ich möchte gerne PDF-Dateien per Software automatisch bearbeiten. Ich kann mir PDF-Dateien erstellen und dort Formularfelder eintragen. Solche Formularfelder können z.B. das Datum oder eine Seriennummer sein. Mittels Python möchte ich eine PDF-Vorlage öffnen und in einige der Formularfelder bereits vorab Einträge reinschreiben, wie das aktuelle Tagesdatum.

Ich habe schon bei Google nach einem PDF-Parser gesucht und es wurden mir auch diverse Ergebnisse angezeigt. Meine Frage ist vorab - geht das, was ich suche, denn überhaupt, dass ich in einem PDF-Dokument nach Formularfeldern suchen und diesen dann einen Wert zuweisen kann? Eine fertige Lösung suche ich nicht, nur eine Idee oder einen Denkansatz, wie ich mein Problem lösen könnte - oder vielleicht auch die Info, dass es garnicht geht.

Für eine Antwort wäre ich sehr dankbar.
Alfons Mittelmeyer
User
Beiträge: 1715
Registriert: Freitag 31. Juli 2015, 13:34

Formularfelder kann man bearbeiten, also geht das.

Dann sollte man also PDF Files mit Formularfeldern erstellen können. Eine Ausführliche Beschreibung des PDF-File Formats gibt es auch.

Hier diese PDF Referenz sollte man gründlich durcharbeiten. Dort ist das PDF File Format recht gut auf etwas über 1300 Seiten beschrieben: http://www.adobe.com/content/dam/Adobe/ ... ce_1-7.pdf
Benutzeravatar
Sr4l
User
Beiträge: 1091
Registriert: Donnerstag 28. Dezember 2006, 20:02
Wohnort: Kassel
Kontaktdaten:

schneehase hat geschrieben:Ich kann mir PDF-Dateien erstellen und dort Formularfelder eintragen. Solche Formularfelder können z.B. das Datum oder eine Seriennummer sein. Mittels Python möchte ich eine PDF-Vorlage öffnen und in einige der Formularfelder bereits vorab Einträge reinschreiben, wie das aktuelle Tagesdatum.
Mir stellt sich die Frage warum du unbedingt PDFs manipulieren möchtest? Du kannst zum Beispiel einfach LaTeX, Word (.docx) oder LibreOffice Dateien (odt) Datei manipulieren und daraus PDFs generieren, so habe ich das für Rechnungen gemacht.

Gefunden habe ich das hier: https://pypi.python.org/pypi/PDFTron-PD ... Python/5.7 die scheinen das zu unterstützen. Ich kenne es jedoch nicht und ist ein kommerzielles Produkt.

*edit*
Das sieht doch auch ganz gut aus: https://pypi.python.org/pypi/pdfjinja/1.0.0 das benutzt pdfminer das wohl recht umfangreich ist https://github.com/euske/pdfminer
schneehase
User
Beiträge: 2
Registriert: Sonntag 23. April 2017, 18:38

Sr4l hat geschrieben:Mir stellt sich die Frage warum du unbedingt PDFs manipulieren möchtest? Du kannst zum Beispiel einfach LaTeX, Word (.docx) oder LibreOffice Dateien (odt) Datei manipulieren und daraus PDFs generieren, so habe ich das für Rechnungen gemacht.
Das ist auch eine schöne Idee. Die PDF-Dateien wurden ja vorher mit Word erstellt. Kann ich Word-Dokumente ohne Probleme vorher bearbeiten?
Benutzeravatar
Sr4l
User
Beiträge: 1091
Registriert: Donnerstag 28. Dezember 2006, 20:02
Wohnort: Kassel
Kontaktdaten:

DOCX Dateien sind ZIP archive. Darin findest du dann in /word/document.xml deinen Text.

Text darin zu ersetzen ist einfach, alles andere eher nicht, aber versuch es einfach mal.
Antworten