Seite 1 von 1

pdf Dateien bearbeiten

Verfasst: Mittwoch 13. Juni 2007, 07:53
von tumbili
Hi

Ich würde gerne mit python eine pdf Datei bearbeiten. Leider habe ich noch nicht die richtige library gefunden :( Ich möchte einen bestimmten Textabschnitt farbig markieren (also zB die Hintergrundfarbe auf Gelb setzen)

Mit pyPdf ist das glaube ich nicht möglich und mit ReportLab kann man pdf dateien nur erstellen, aber nicht öffnen wenn ich die doku richtig verstanden habe...

Habt ihr noch eine andere Idee?

Achja, die Datei muss nicht unbedingt als PDF ausgegeben werden. Ich möchte sie nur (mit der markierung) anzeigen. Deswegen hatte ich überlegt sie nach rtf zu konvertieren, aber da hat die darstellung leider drunter gelitten :(

Vielen Dank schonmal :)

Verfasst: Freitag 15. Juni 2007, 10:30
von tumbili
hat keiner eine Idee? oder ist das vielleicht gar nicht möglich? :(

Verfasst: Freitag 15. Juni 2007, 12:32
von mitsuhiko
Vergiss es. Aber warum musst du die Dinger bearbeiten?

Verfasst: Freitag 15. Juni 2007, 13:13
von tumbili
blackbird hat geschrieben:Vergiss es. Aber warum musst du die Dinger bearbeiten?
Es sind lange pdf Dokumente und ich möchte darin verschiedene Abschnitte hervorheben (zb. Hintergrundfarbe gelb) und anzeigen lassen.

Muss ich mal schauen ob ich wenigstens automatisch zu den Abschnitten scrollen kann...

Verfasst: Freitag 15. Juni 2007, 13:25
von lunar
PDF wurde nicht zum Bearbeiten entworfen. Das ist ein Format zur Anzeige und zum Ausdruck von Dokumenten. Deswegen solltest du blackbirds Ratschlag folgen.

Verfasst: Freitag 15. Juni 2007, 13:30
von tumbili
lunar hat geschrieben:PDF wurde nicht zum Bearbeiten entworfen. Das ist ein Format zur Anzeige und zum Ausdruck von Dokumenten. Deswegen solltest du blackbirds Ratschlag folgen.
kann ich leider nicht ändern :( Ich habe nunmal diese langen dokumente als pdf Dateien vorliegen und muss da irgendwie Informationen draus hervorheben.. (zur Not halt nur die entsprechende Seite aufrufen)

Verfasst: Freitag 15. Juni 2007, 14:22
von Michael Schneider
Hi tumbili,

dafür ein Skript oder Programm zu schreiben fände ich nur dann sinnvoll, wenn Du auch vollautomatisch nach irgendwelchen Stellen suchst. Sonst geht es sicherlich schneller und unkomplizierter, die in einem normalen Pdf-Editor zu öffnen und zu bearbeiten.
Und ja, in diesem Fall würde ich Dir wirklich empfehlen, die im Textformat abzuspeichern und als Text anzuzeigen. Dann ist das Markieren ein Klacks.

Worin liegt denn das genaue Problem bei diesem Ansatz?

Gruß,
Michael

Verfasst: Freitag 15. Juni 2007, 14:33
von tumbili
erstmal sind das nicht "meine" PDF Dateien, sonst würde ich die ja anders speichern... Also die Texte liegen wirklich nur als PDF Dateien vor und daran kann ich auch nix ändern (außer selbst irgendwie konvertieren, aber leider gehen dabei ja viele Formatierungen verloren :( )

Ich würde gerne die einzelnen Bereiche in einer xml Datei definieren, das Script markiert dann den gewünschten Bereich und zeigt diesen an...

Verfasst: Freitag 15. Juni 2007, 15:22
von lunar
tumbili hat geschrieben:erstmal sind das nicht "meine" PDF Dateien, sonst würde ich die ja anders speichern...
Ja, aber da können wir jetzt auch nichts dafür...
Also die Texte liegen wirklich nur als PDF Dateien vor und daran kann ich auch nix ändern (außer selbst irgendwie konvertieren, aber leider gehen dabei ja viele Formatierungen verloren :( )
Du könntest dem, der dir die Dateien gegeben hat, klarmachen, dass seine Anforderung mit PDF-Dateien bestenfalls sehr, sehr schwer zu erfüllen ist.
Ich würde gerne die einzelnen Bereiche in einer xml Datei definieren, das Script markiert dann den gewünschten Bereich und zeigt diesen an...
Wie blackbird schon sagte: Vergiss es. Es mag möglich sein, irgend einen PDF Viewer über IPC oder COM fernzusteuern, und so das gewünschte zu erreichen, aber das wird aufwendig.

Verfasst: Freitag 15. Juni 2007, 15:37
von N317V
Ich hab mich vor zirka zwei Jahren mal mit ReportLab beschäftigt und ich meine mich zu erinnern, dass man eine bestehende PDF-Datei als Vorlage für ein zu erstellendes Dokument verwenden kann. Ich weiß zwar nicht, ob Dir das weiterhilft und ich bin mir auch nicht sicher...

Verfasst: Freitag 15. Juni 2007, 16:43
von CM
Hat mich auch interessiert. Ich habe dies gefunden:
http://www.reportlab.org/devfaq.html#2.1.5

Mit anderen Worten: Es geht, aber auf diesem Wege kostet es Geld.

Gruß,
Christian

Verfasst: Mittwoch 20. Juni 2007, 14:14
von tumbili
ich habe mir gerade mal das ActiveX control "PDFWindow" von wxPython angeschaut... dort gibt es eine Methode setCurrentHighlight(self, a, b, c, d)

aber ich bekomme die irgendwie nicht zu laufen. es passiert einfach gar nix :(

In der adobe referenz finde ich nur folgendes:

Code: Alles auswählen

void setCurrentHighlight(LONG nLeft, LONG nTop, LONG nRight, LONG nBottom);
Description
	Highlights the text selection within the specified bounding rectangle on the current page.
Parameters
	nLeft
		The distance in points from the left side of the page.
	nTop
		The distance in points from the top of the page.
	nRight
		The width of the bounding rectangle.
	nBottom
		The height of the bounding rectangle.
Return Value
	None.
Related Methods
	None
Wisst ihr wie ich die Methode richtig anwende?