Bester HTML-Parser

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
nemomuk
User
Beiträge: 862
Registriert: Dienstag 6. November 2007, 21:49

Donnerstag 11. September 2008, 21:21

Hallo,

ich suche einen guten und vor allem fehlertoleranten HTML Parser, der auch schlecht gecodete Seite parsen kann. Derzeit verwende ich Beautifulsoup und wollte fragen, ob das eine gute Wahl ist oder ob es noch bessere gibt?

Danke!
MfG
Leonidas
Administrator
Beiträge: 16024
Registriert: Freitag 20. Juni 2003, 16:30
Kontaktdaten:

Donnerstag 11. September 2008, 21:46

html5lib und lxml.html (wobei ich bei letzterem nicht weiß wie fehlertolerant er genau ist, aber ersterer parst wie ein Browser).
My god, it's full of CARs! | Leonidasvoice vs Modvoice
Antworten