Der SGMLParser kann ja ganz gut HTML-Dateien Parsen. s. http://www.python-forum.de/viewtopic.php?p=13254
Aber es gibt ja noch den HTMLParser... Wo liegt der Unterschied?
EDIT:
Hab mir das angeschaut:
http://www.python.org/doc/lib/module-HTMLParser.html
http://www.python.org/doc/lib/module-sgmllib.html
Also ist der HTMLParser spezialisiert auf HTML-Daten, während der SGMLParser allgemeine Dateien (Standard Generalized Mark-up Language) Parsen kann...
Nur: Kann man HTML-Dateine besser mit HTMLParser verarbeiten, als mit SGMLParser??? Wenn nicht ist der spezialisierte Parser wohl überflüssig, oder?