re.split()

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
DR4GON
User
Beiträge: 3
Registriert: Montag 25. Juli 2005, 08:44

Freitag 29. Juli 2005, 12:14

Hallo zusammen,

ich möchte gern eine Tabelle einer Internet Seite so zerschneiden, dass ich nachher nur noch die einzelnen Table Rows sehen kann.

Wie geht das genau? Habe es schon hiermit versucht aber da bekomme ich kein sinnvolles Ergebnis.

Code: Alles auswählen

TableSplitter = re.compile('<tr.*>')
ROW = TableSplitter.split(TABLE)
Haben möchte ich eigentlich sowas wie das hier:

<td ...> ... </td><td ..> ... </td></tr>

wenn möglich auch direkt ohne das </tr>, wenn jemand wissen sollte wie's geht.

Grüße

DR4GON
Benutzeravatar
jens
Moderator
Beiträge: 8481
Registriert: Dienstag 10. August 2004, 09:40
Wohnort: duisburg
Kontaktdaten:

Dienstag 2. August 2005, 11:28

Code: Alles auswählen

import urllib2, re

url = urllib2.urlopen("http://www.python-forum.de")
page = url.read()
url.close()

for line in re.findall(r'<td.*?>(.*?)</td>', page ):
    print line
und schau mal hier: http://www.python-forum.de/viewtopic.php?t=3617

CMS in Python: http://www.pylucid.org
GitHub | Open HUB | Xing | Linked in
Bitcoins to: 1JEgSQepxGjdprNedC9tXQWLpS424AL8cd
Antworten