Seite 1 von 1

path bei lxml

Verfasst: Dienstag 5. Juli 2011, 18:48
von surfhai
Hallo,

ich verzweifle hier gerade die Funktion find mit den Richtigen Parametern zu füttern.

Code: Alles auswählen

#!/usr/bin/env python2
# coding=utf-8
import html5lib

html = '<html><head></head><body><table id=content_table></table><body></html>'
tree = html5lib.parse(html, treebuilder="lxml")
e = tree.find('html/body/table')
print(e)
Das Minimalbeispiel sollte doch eine Ausgabe generieren. Die Variable e ist jedenfalls immer leer, egal was ich bisher probiert hab um tree.find() zu füttern.

Gruß Thorsten

Re: path bei lxml

Verfasst: Dienstag 5. Juli 2011, 19:04
von surfhai

Code: Alles auswählen

#!/usr/bin/env python2
# coding=utf-8
import html5lib

html = '<html><head></head><body><table id=content_table></table><body></html>'
tree = html5lib.parse(html, treebuilder="lxml", namespaceHTMLElements=False)
e = tree.find("body/table")
print(e)
liefert endlich ein Ergebnis...