Hallo,
aus einer HTML-Datei will ich folgendes auslesen:
.
.
.
<td valign="bottom"> </td>
<td>DIESEN TEXT WILL ICH</td>
<td valign="bottom"> </td>
<td>DIESEN TEXT WILL ICH</td>
<td valign="bottom"> </td>
<td>DIESEN TEXT WILL ICH</td>
.
.
Aber
pat=re.compile(r"<td valign="bottom"> </td><td>(.*?)</td>",re.I)
findet es nicht. Kann mir jemand helfen?
Danke!
Reguläre Ausdrücke über mehrere Zeilen
-
- Python-Forum Veteran
- Beiträge: 1209
- Registriert: Montag 29. September 2003, 17:18
- Wohnort: Purkersdorf (bei Wien [Austria])
Hi!
Reicht in diesem Fall nicht:
Gruß, mawe
Kann es auch nicht, weil ein \n zwischen </tb> und <tb> steht.Nappio hat geschrieben: findet es nicht
Reicht in diesem Fall nicht:
Code: Alles auswählen
import re
f = file("datei.html","r")
pat = re.compile(r'<td>([\w\s]+?)</td>')
for line in f.readlines():
m = pat.match(line)
if m:
print m.groups()
Gruß, mawe