path bei lxml

Sockets, TCP/IP, (XML-)RPC und ähnliche Themen gehören in dieses Forum
Antworten
surfhai
User
Beiträge: 10
Registriert: Montag 21. Dezember 2009, 22:45

Hallo,

ich verzweifle hier gerade die Funktion find mit den Richtigen Parametern zu füttern.

Code: Alles auswählen

#!/usr/bin/env python2
# coding=utf-8
import html5lib

html = '<html><head></head><body><table id=content_table></table><body></html>'
tree = html5lib.parse(html, treebuilder="lxml")
e = tree.find('html/body/table')
print(e)
Das Minimalbeispiel sollte doch eine Ausgabe generieren. Die Variable e ist jedenfalls immer leer, egal was ich bisher probiert hab um tree.find() zu füttern.

Gruß Thorsten
surfhai
User
Beiträge: 10
Registriert: Montag 21. Dezember 2009, 22:45

Code: Alles auswählen

#!/usr/bin/env python2
# coding=utf-8
import html5lib

html = '<html><head></head><body><table id=content_table></table><body></html>'
tree = html5lib.parse(html, treebuilder="lxml", namespaceHTMLElements=False)
e = tree.find("body/table")
print(e)
liefert endlich ein Ergebnis...
Antworten