Bester HTML-Parser

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
nemomuk
User
Beiträge: 862
Registriert: Dienstag 6. November 2007, 21:49

Bester HTML-Parser

Beitragvon nemomuk » Donnerstag 11. September 2008, 21:21

Hallo,

ich suche einen guten und vor allem fehlertoleranten HTML Parser, der auch schlecht gecodete Seite parsen kann. Derzeit verwende ich Beautifulsoup und wollte fragen, ob das eine gute Wahl ist oder ob es noch bessere gibt?

Danke!
MfG
Benutzeravatar
Leonidas
Administrator
Beiträge: 16023
Registriert: Freitag 20. Juni 2003, 16:30
Kontaktdaten:

Beitragvon Leonidas » Donnerstag 11. September 2008, 21:46

html5lib und lxml.html (wobei ich bei letzterem nicht weiß wie fehlertolerant er genau ist, aber ersterer parst wie ein Browser).
My god, it's full of CARs! | Leonidasvoice vs Modvoice

Wer ist online?

Mitglieder in diesem Forum: Google [Bot]