Seite 1 von 1

Gesucht: Modul um RTF-Datei auszulesen?

Verfasst: Montag 19. Januar 2009, 14:30
von metty
Hallo zusammen,

ich bin auf der Suche nach einem Modul, mit dem ich RTF-Dateien auslesen kann. Mit PyRTF kann man, soweit ich es verstanden habe nur RTF-Dokumente erstellen, jedoch nicht auslesen.
Vor allem die Formatierung wie Fett, Unterstrichen usw. sollte man dabei auslesen können, um quasi erkennen zu können welches Wort bzw. Satz wie formatiert ist.

Mit Regulären Ausdrücken würde es natürlich auch funktionieren, aber vielleicht gibt es ja schon was...

Vielen Dank.

Freundliche Grüße

Verfasst: Montag 19. Januar 2009, 17:29
von abgdf
Hallo,

fragt sich, was das Modul dann machen soll, wenn es z.B. "fett" erkannt hat. Ich könnte mir vorstellen, daß Dir

http://sourceforge.net/projects/rtf2xml/

helfen könnte.

Gruß

Verfasst: Montag 19. Januar 2009, 17:44
von Hyperion
abgdf hat geschrieben: fragt sich, was das Modul dann machen soll, wenn es z.B. "fett" erkannt hat.
Wieso das denn? Bei anderen Markup-Parsern geht es ja auch erst einmal darum, dem Benutzer einer Struktur in die Hand zu geben, die das Dokument repräsentiert. Innerhalb dieser Struktur sollte man dann in der Lage sein, Attribute eines zugehörigen "Knotens" auszulesen oder gar zu manipulieren.

Genauso kann das doch auch bei RTF laufen! Da braucht das Modul gar nichts groß "machen".

Hast Du Dir das hier mal angeguckt? Steht zumindest da, dass man RTF auch parsen können soll!
http://code.google.com/p/pyrtf-ng/

Verfasst: Montag 19. Januar 2009, 20:29
von abgdf
Hyperion hat geschrieben:Bei anderen Markup-Parsern geht es ja auch erst einmal darum, dem Benutzer einer Struktur in die Hand zu geben, die das Dokument repräsentiert. Innerhalb dieser Struktur sollte man dann in der Lage sein, Attribute eines zugehörigen "Knotens" auszulesen oder gar zu manipulieren.
Deswegen gibt einem das genannte "rtf2xml" ja auch eine xml-Struktur in die Hand.

Gruß