Seite 1 von 1

mit reg. expr. urls bearbeiten

Verfasst: Dienstag 19. Juni 2007, 11:22
von Or-K
hallo,

ich bin gaaanz frisch in python und habe ein kleines problem mit regular expressions. Gewünscht ist, dass in den urls der Pfad "/pdfs" verschwindet, d.h. aus "http://meineurl.com/downloads/SSID/pdfs/document.pdf" soll werden "http://meineurl.com/downloads/[SSID]/document.pdf"

mein ausdruck lautet bisher

Code: Alles auswählen

  pattern = r"(pdfs\w*/)"
  result  = re.sub( pattern, "", result)
leider funktioniert das nicht... Ich schätze mal, es liegt am reg. expr. Kann mir jemand sagen warum bzw. wie ich es richtig machen kann, das wäre echt super.

danke
grüße

Verfasst: Dienstag 19. Juni 2007, 12:14
von BlackJack
Was heisst "funktioniert nicht"? Bei mir schon:

Code: Alles auswählen

In [20]: pattern = r'(pdfs\w*/)'

In [21]: url = 'http://meineurl.com/downloads/SSID/pdfs/document.pdf'

In [22]: re.sub(pattern, '', url)
Out[22]: 'http://meineurl.com/downloads/SSID/document.pdf'
Probleme bekommt man aber, wenn 'pdfs' auch als Teilzeichenkette an anderer Stelle auftauchen kann.

Letztendlich braucht man `re` hier aber gar nicht. Ein einfaches `replace()` reicht:

Code: Alles auswählen

In [23]: url.replace('/pdfs/', '/')
Out[23]: 'http://meineurl.com/downloads/SSID/document.pdf'