Na aber laut Wikipedia sind xml-Dokumente mit
RSS-Standart alle nach dem gleichen Muster aufgebaut. Darum dachte ich, dass ichs mir einfahc machen könnte und quasi immer nur nach den Tags wie <title>, <description ... etc. suchen kann. Warum muss ich da großartig mit XML-Bäumen rumhandtieren? Solange ich wirklich nur RSS-XML parse sollte das doch glatt laufen?
In der aktuellen CT (05/09) gibt es folgenden PHP-Schnipsel für ein ähnliches Problem:
Code: Alles auswählen
$titel = preg_match('#<title>(.+?)</title>#'), $inhalt, $treffer)? $treffer[1] : $pfad;
In diesem Abschnitt gehts darum den Titel eines HTML-Dokuments auszulesen. Kann man soetwas nicht auch in Python übersetzen?
Oder noch einfacher: Kann ich nicht wenigstens nach dem nächsten "<title>" bzw. "</title>" suchen? Den rest kann man sich ja selbst zusammen basteln... Gibt es da eine Funktion für?