Das deutsche Python-Forum

Hallo zusammen,

ich möchte gern eine Tabelle einer Internet Seite so zerschneiden, dass ich nachher nur noch die einzelnen Table Rows sehen kann.

Wie geht das genau? Habe es schon hiermit versucht aber da bekomme ich kein sinnvolles Ergebnis.

Code: Alles auswählen

TableSplitter = re.compile('<tr.*>')
ROW = TableSplitter.split(TABLE)

Haben möchte ich eigentlich sowas wie das hier:

<td ...> ... </td><td ..> ... </td></tr>

wenn möglich auch direkt ohne das </tr>, wenn jemand wissen sollte wie's geht.

Grüße

DR4GON

Code: Alles auswählen

import urllib2, re

url = urllib2.urlopen("http://www.python-forum.de")
page = url.read()
url.close()

for line in re.findall(r'<td.*?>(.*?)</td>', page ):
    print line

und schau mal hier: http://www.python-forum.de/viewtopic.php?t=3617

Das deutsche Python-Forum

re.split()

re.split()