ich wollte mal fragen, ob jemand von euch einen guten Weg kennt ein HTML-Code (wie folgt) von allen beinhaltenden Klassen zu "bereinigen", sodass nurnoch der "eigentliche" Text übrig bleibt.
Ich hatte es schon mit dem "re"-Module ausprobiert aber da kam ich trotz der Dokumentation nicht sehr weit (besser gesagt überhaupt nicht weit...)
Html-Code:
Code: Alles auswählen
<a href="http://www.taz.de/1/politik/amerika/artikel/1/regierung-befuerchtet-ueber-100000-opfer/">
<img align="left" src="http://www.taz.de/uploads/tx_hptazarticle/../hp_taz_img/rtea/Haiti.jpg" border="0" width="136" height="68" alt="" /></a>
Einen Tag nach dem Erdbeben in Haiti ist das Ausmaß der Katastrophe noch immer unklar. Die ersten Hilfsgüter treffen ein, aber die Versorgung
der Menschen ist unzureichend. <a href="http://www.taz.de/1/politik/amerika/artikel/1/regierung-befuerchtet-ueber-100000-opfer/">mehr...</a>
<p>Mehr zum Thema:
<div>
<a href="http://www.taz.de/1/politik/amerika/artikel/1/es-gibt-kein-wasser-es-gibt-nichts/">
Katastrophen-Hilfe in Haiti: "Es gibt kein Wasser. Es gibt nichts"
</a>
</div>
<div>
<a href="http://www.taz.de/1/politik/amerika/artikel/1/ein-haufen-schutt/">
Erdbeben auf Haiti: Ein Haufen Schutt
</a>
</div>
<div>
<a href="http://www.taz.de/1/politik/amerika/artikel/1/das-katastrophenland/">
Länderkunde Haiti: Das Katastrophenland
</a>
</div>
<div>
<a href="http://www.taz.de/1/debatte/kommentar/artikel/1/neustart-fuer-ein-kaputtes-land/">
Kommentar Haiti: Neustart für ein kaputtes Land
</a>
</div>
</p>
microkernel