Hallo,
ich suche gerade nach einer Möglichkeit in einer PDF-Datei ein paar Informationen auszutauschen. Die fertige PDF-Datei wäre vorhanden, ich möchte nur ein paar Infos (Anschrift etc.) dynamisch einfügen.
Ich habe mich schonmal auf pypi umgeschaut, finde aber nicht wirklich ein passendes Tool...
Kennt hier jemand ein passendes?
Danke!
MfG
Python PDF
Ich wüsste nur (Stichwort Jython) die Java-Bibliothek iText, die so etwas kann.
Vor 7 Jahren hatte ich mal einenParser für PDF-1.2 gebaut. Inzwischen ist aber der Standard bei 1.7 oder so angekommen und deutlich umfangreicher geworden. Je nachdem wie komplex dein Dokument und wie neu dein Generator ist, wäre ein eigener Parser dennoch ein gangbarer Weg. Im Prinzip (und daran hat sich bestimmt nicht viel geändert) besteht eine PDF-Datei aus einem Index, der sagt, wo in der Datei Objekte stecken, die dann Sammlungen von PDF-Befehlen sind, die wiederum an Postscript erinnern. Normalerweise sind die Objekte komprimiert - wenn ich's richtig erinnere aber mit gzip, was Python ja beherrscht. Irgendwann kommt man dann zu Strings, in denen man dann Ersetzungen vornehmen könnte. Dies darf natürlich nicht das Layout brechen oder man hat ein sehr großes Problem, weil man dann ja erstmal verstehen muss, was die Befehle eigentlich machen und dann alles selbst neu malen muss.
Stefan
Vor 7 Jahren hatte ich mal einenParser für PDF-1.2 gebaut. Inzwischen ist aber der Standard bei 1.7 oder so angekommen und deutlich umfangreicher geworden. Je nachdem wie komplex dein Dokument und wie neu dein Generator ist, wäre ein eigener Parser dennoch ein gangbarer Weg. Im Prinzip (und daran hat sich bestimmt nicht viel geändert) besteht eine PDF-Datei aus einem Index, der sagt, wo in der Datei Objekte stecken, die dann Sammlungen von PDF-Befehlen sind, die wiederum an Postscript erinnern. Normalerweise sind die Objekte komprimiert - wenn ich's richtig erinnere aber mit gzip, was Python ja beherrscht. Irgendwann kommt man dann zu Strings, in denen man dann Ersetzungen vornehmen könnte. Dies darf natürlich nicht das Layout brechen oder man hat ein sehr großes Problem, weil man dann ja erstmal verstehen muss, was die Befehle eigentlich machen und dann alles selbst neu malen muss.
Stefan
Vielleicht gibt's PDF Parser in Perl, die man portieren koennte?sma hat geschrieben:Ich wüsste nur (Stichwort Jython) die Java-Bibliothek iText, die so etwas kann.
http://www.perlmonks.org/?node_id=653511
altenativ auch direkt das Perl Modul nehmen:
http://search.cpan.org/perldoc?Inline::Python
http://search.cpan.org/perldoc?perlmodule
Vor allem perlmodule sieht gar nicht so doof aus.
http://search.cpan.org/perldoc?Inline::Python
http://search.cpan.org/perldoc?perlmodule
Vor allem perlmodule sieht gar nicht so doof aus.
Eine Möglichkeit wäre, pyPdf entsprechend anzupassen:SchneiderWeisse hat geschrieben: Kennt hier jemand ein passendes?
http://pybrary.net/pyPdf
Hi, mein erstes Posting in diesem Forum!
Gruß
Klaus
Genau das Problem hatte auch ich vor einiger Zeit. Mir sind zwei Python-Tools bekannt, die dies können: die kommerzielle Variante von ReportLab sowie die gleichfalls kommerzielle pdflib http://www.pdflib.de. Die pdflib lässt sich beliebig lange testen, fügt unregistriert aber jedem erzeugten PDF ein Wasserzeichen hinzu. Ein kostenfreies Python-Tool zur Modifizierung bestehender PDFs kenne ich leider nicht.SchneiderWeisse hat geschrieben: ich suche gerade nach einer Möglichkeit in einer PDF-Datei ein paar Informationen auszutauschen. Die fertige PDF-Datei wäre vorhanden, ich möchte nur ein paar Infos (Anschrift etc.) dynamisch einfügen.
Ich habe mich schonmal auf pypi umgeschaut, finde aber nicht wirklich ein passendes Tool...
Kennt hier jemand ein passendes?
Danke!
MfG
Gruß
Klaus