mit reg. expr. urls bearbeiten

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
Or-K
User
Beiträge: 1
Registriert: Dienstag 19. Juni 2007, 11:14

Dienstag 19. Juni 2007, 11:22

hallo,

ich bin gaaanz frisch in python und habe ein kleines problem mit regular expressions. Gewünscht ist, dass in den urls der Pfad "/pdfs" verschwindet, d.h. aus "http://meineurl.com/downloads/SSID/pdfs/document.pdf" soll werden "http://meineurl.com/downloads/[SSID]/document.pdf"

mein ausdruck lautet bisher

Code: Alles auswählen

  pattern = r"(pdfs\w*/)"
  result  = re.sub( pattern, "", result)
leider funktioniert das nicht... Ich schätze mal, es liegt am reg. expr. Kann mir jemand sagen warum bzw. wie ich es richtig machen kann, das wäre echt super.

danke
grüße
BlackJack

Dienstag 19. Juni 2007, 12:14

Was heisst "funktioniert nicht"? Bei mir schon:

Code: Alles auswählen

In [20]: pattern = r'(pdfs\w*/)'

In [21]: url = 'http://meineurl.com/downloads/SSID/pdfs/document.pdf'

In [22]: re.sub(pattern, '', url)
Out[22]: 'http://meineurl.com/downloads/SSID/document.pdf'
Probleme bekommt man aber, wenn 'pdfs' auch als Teilzeichenkette an anderer Stelle auftauchen kann.

Letztendlich braucht man `re` hier aber gar nicht. Ein einfaches `replace()` reicht:

Code: Alles auswählen

In [23]: url.replace('/pdfs/', '/')
Out[23]: 'http://meineurl.com/downloads/SSID/document.pdf'
Antworten