Ich versuch jetzt schon seit n paar Stunden dahinter zu kommen wie man mit python HTML parst, komm aber einfach nicht weiter. Als parser wolle ich den HTMLParser nehmen weil er soviel ich gelesen hab auch XHTML kann. Mein ziel ist den Inhalt zwischen <textarea id="code" class="codeedit" name="code" cols="80" rows="10" onkeydown="checkTab(this)"> und </textarea> zu parsen mein bisheriger Ansatz auf Basis des Beispielscrips in der modulelibarie sieht so aus:
Code: Alles auswählen
class MyHTMLParser(HTMLParser):
def handle_starttag(self, tag, attrs):
if tag == "textarea":
print "Encountered the beginning of a textarea tag"
def handle_endtag(self, tag):
if tag == "textarea":
print "Encountered the end of a textarea tag"
MyHTMLParser().feed(html)
Danke schon mal für die sicher wieder kompetente Hilfe
pythonist