Gesucht: Modul um RTF-Datei auszulesen?

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
metty
User
Beiträge: 99
Registriert: Samstag 13. Dezember 2008, 19:30

Gesucht: Modul um RTF-Datei auszulesen?

Beitragvon metty » Montag 19. Januar 2009, 14:30

Hallo zusammen,

ich bin auf der Suche nach einem Modul, mit dem ich RTF-Dateien auslesen kann. Mit PyRTF kann man, soweit ich es verstanden habe nur RTF-Dokumente erstellen, jedoch nicht auslesen.
Vor allem die Formatierung wie Fett, Unterstrichen usw. sollte man dabei auslesen können, um quasi erkennen zu können welches Wort bzw. Satz wie formatiert ist.

Mit Regulären Ausdrücken würde es natürlich auch funktionieren, aber vielleicht gibt es ja schon was...

Vielen Dank.

Freundliche Grüße
abgdf

Beitragvon abgdf » Montag 19. Januar 2009, 17:29

Hallo,

fragt sich, was das Modul dann machen soll, wenn es z.B. "fett" erkannt hat. Ich könnte mir vorstellen, daß Dir

http://sourceforge.net/projects/rtf2xml/

helfen könnte.

Gruß
Benutzeravatar
Hyperion
Moderator
Beiträge: 7472
Registriert: Freitag 4. August 2006, 14:56
Wohnort: Hamburg
Kontaktdaten:

Beitragvon Hyperion » Montag 19. Januar 2009, 17:44

abgdf hat geschrieben:fragt sich, was das Modul dann machen soll, wenn es z.B. "fett" erkannt hat.

Wieso das denn? Bei anderen Markup-Parsern geht es ja auch erst einmal darum, dem Benutzer einer Struktur in die Hand zu geben, die das Dokument repräsentiert. Innerhalb dieser Struktur sollte man dann in der Lage sein, Attribute eines zugehörigen "Knotens" auszulesen oder gar zu manipulieren.

Genauso kann das doch auch bei RTF laufen! Da braucht das Modul gar nichts groß "machen".

Hast Du Dir das hier mal angeguckt? Steht zumindest da, dass man RTF auch parsen können soll!
http://code.google.com/p/pyrtf-ng/
abgdf

Beitragvon abgdf » Montag 19. Januar 2009, 20:29

Hyperion hat geschrieben:Bei anderen Markup-Parsern geht es ja auch erst einmal darum, dem Benutzer einer Struktur in die Hand zu geben, die das Dokument repräsentiert. Innerhalb dieser Struktur sollte man dann in der Lage sein, Attribute eines zugehörigen "Knotens" auszulesen oder gar zu manipulieren.

Deswegen gibt einem das genannte "rtf2xml" ja auch eine xml-Struktur in die Hand.

Gruß

Wer ist online?

Mitglieder in diesem Forum: Bing [Bot]