mit regex Links auslesen
Verfasst: Donnerstag 1. September 2005, 17:39
hallöchen,
ich bin noch ganz neu bei regex und naja, irgendwie lappt das hier nicht so wie es soll. Kann mit einer von euch sagen wieso, ich rätsle nämlich schon stundenlang rum?
naja, Dieser Code sollte eigentlich aus einer beliebigen html- datei alle links auslesen ... aber irgendwie klappt das nicht so ganz ... könnt ihr mir helfen??
mfg cime
ich bin noch ganz neu bei regex und naja, irgendwie lappt das hier nicht so wie es soll. Kann mit einer von euch sagen wieso, ich rätsle nämlich schon stundenlang rum?
Code: Alles auswählen
import re
def get_all_links(code):
list=[]
for a in ['a','A']:
x=re.compile(r'<'+a+r'.+href="([.^]+)".*>',re.M | re.S)
for i in x.findall(code):
print i
return list
f=open("ftpcommands.htm",'r')
print get_all_links(f.read())
f.close()
mfg cime