Seite 1 von 1

re.split()

Verfasst: Freitag 29. Juli 2005, 12:14
von DR4GON
Hallo zusammen,

ich möchte gern eine Tabelle einer Internet Seite so zerschneiden, dass ich nachher nur noch die einzelnen Table Rows sehen kann.

Wie geht das genau? Habe es schon hiermit versucht aber da bekomme ich kein sinnvolles Ergebnis.

Code: Alles auswählen

TableSplitter = re.compile('<tr.*>')
ROW = TableSplitter.split(TABLE)
Haben möchte ich eigentlich sowas wie das hier:

<td ...> ... </td><td ..> ... </td></tr>

wenn möglich auch direkt ohne das </tr>, wenn jemand wissen sollte wie's geht.

Grüße

DR4GON

Verfasst: Dienstag 2. August 2005, 11:28
von jens

Code: Alles auswählen

import urllib2, re

url = urllib2.urlopen("http://www.python-forum.de")
page = url.read()
url.close()

for line in re.findall(r'<td.*?>(.*?)</td>', page ):
    print line
und schau mal hier: http://www.python-forum.de/viewtopic.php?t=3617