Hallo zusammen,
ich bin auf der Suche nach einem Modul, mit dem ich RTF-Dateien auslesen kann. Mit PyRTF kann man, soweit ich es verstanden habe nur RTF-Dokumente erstellen, jedoch nicht auslesen.
Vor allem die Formatierung wie Fett, Unterstrichen usw. sollte man dabei auslesen können, um quasi erkennen zu können welches Wort bzw. Satz wie formatiert ist.
Mit Regulären Ausdrücken würde es natürlich auch funktionieren, aber vielleicht gibt es ja schon was...
Vielen Dank.
Freundliche Grüße
Gesucht: Modul um RTF-Datei auszulesen?
Hallo,
fragt sich, was das Modul dann machen soll, wenn es z.B. "fett" erkannt hat. Ich könnte mir vorstellen, daß Dir
http://sourceforge.net/projects/rtf2xml/
helfen könnte.
Gruß
fragt sich, was das Modul dann machen soll, wenn es z.B. "fett" erkannt hat. Ich könnte mir vorstellen, daß Dir
http://sourceforge.net/projects/rtf2xml/
helfen könnte.
Gruß
- Hyperion
- Moderator
- Beiträge: 7478
- Registriert: Freitag 4. August 2006, 14:56
- Wohnort: Hamburg
- Kontaktdaten:
Wieso das denn? Bei anderen Markup-Parsern geht es ja auch erst einmal darum, dem Benutzer einer Struktur in die Hand zu geben, die das Dokument repräsentiert. Innerhalb dieser Struktur sollte man dann in der Lage sein, Attribute eines zugehörigen "Knotens" auszulesen oder gar zu manipulieren.abgdf hat geschrieben: fragt sich, was das Modul dann machen soll, wenn es z.B. "fett" erkannt hat.
Genauso kann das doch auch bei RTF laufen! Da braucht das Modul gar nichts groß "machen".
Hast Du Dir das hier mal angeguckt? Steht zumindest da, dass man RTF auch parsen können soll!
http://code.google.com/p/pyrtf-ng/
Deswegen gibt einem das genannte "rtf2xml" ja auch eine xml-Struktur in die Hand.Hyperion hat geschrieben:Bei anderen Markup-Parsern geht es ja auch erst einmal darum, dem Benutzer einer Struktur in die Hand zu geben, die das Dokument repräsentiert. Innerhalb dieser Struktur sollte man dann in der Lage sein, Attribute eines zugehörigen "Knotens" auszulesen oder gar zu manipulieren.
Gruß