regular expression parser...
Verfasst: Freitag 23. November 2007, 13:50
Hallo,
also ich habe mich in die re klasse in python verliebt und finde das Sie fast schon die funktionalität mitbringt um Sie als komplett parametrisierbaren Parser zu misbrauchen. Mir schwebt da folgender Input vor:
und folgender Ausdruck dazu:
Jetzt wäre es super wenn man folgendes Ergebnis bekommen könnte:
Dann könnte man eigentlich in einer Regular Expression sehr komplexe Dokumentstrukturen beschreiben und diese auf einen Schlag Parsen lassen.
Mit re.findall geht das Leider nicht. Gibt es vielleicht schon irgendwas integriert, was sowas könnte oder eine passende Bibliothek? Oder hat jemand einen besseren Ansatz für diese Arten von Problemen?
vielen dank im voraus
template
also ich habe mich in die re klasse in python verliebt und finde das Sie fast schon die funktionalität mitbringt um Sie als komplett parametrisierbaren Parser zu misbrauchen. Mir schwebt da folgender Input vor:
Code: Alles auswählen
<tr><td>val 1</td><td>val 2</td><td>val 3</td></tr>
Code: Alles auswählen
(<tr>(<td>[^<]+?</td>)+</tr>)
Code: Alles auswählen
('<tr><td>val 1</td><td>val 2</td><td>val 3</td></tr>',
( 'val 1',
'val 2',
'val 3'
)
)
Mit re.findall geht das Leider nicht. Gibt es vielleicht schon irgendwas integriert, was sowas könnte oder eine passende Bibliothek? Oder hat jemand einen besseren Ansatz für diese Arten von Problemen?
vielen dank im voraus
template