Ich hab ein kleines Problem mit RE bzw re.findall und zwar möchte ich "Titel" und "ID" aus einem HTML-Dokument extrahieren.
Bei meinen Versuchen wird immer nur die "ID", gar nichts, zuviel gefunden oder es wird beides gefunden jedoch nur EIN Treffer!
HTML:
Code: Alles auswählen
<item>
<title>FOOBAR TITEL</title>
<category>Mein Foobar</category>
<description>Hier findet Ihr Foobar über meine Foobar</description>
<link>http://foobar.org/about.php?id=111111&</link>
</item>
Code: Alles auswählen
findall('<title>(.*)</title>\s.*id=([\d]+)&', self.opener.open(self.db_hostname + self.db_rss % cat).read(), re.DOTALL)