Seite 1 von 1

Bester HTML-Parser

Verfasst: Donnerstag 11. September 2008, 21:21
von nemomuk
Hallo,

ich suche einen guten und vor allem fehlertoleranten HTML Parser, der auch schlecht gecodete Seite parsen kann. Derzeit verwende ich Beautifulsoup und wollte fragen, ob das eine gute Wahl ist oder ob es noch bessere gibt?

Danke!
MfG

Verfasst: Donnerstag 11. September 2008, 21:46
von Leonidas
html5lib und lxml.html (wobei ich bei letzterem nicht weiß wie fehlertolerant er genau ist, aber ersterer parst wie ein Browser).