mit reg. expr. urls bearbeiten

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Or-K
User
Beiträge: 1
Registriert: Dienstag 19. Juni 2007, 11:14

mit reg. expr. urls bearbeiten

Beitragvon Or-K » Dienstag 19. Juni 2007, 11:22

hallo,

ich bin gaaanz frisch in python und habe ein kleines problem mit regular expressions. Gewünscht ist, dass in den urls der Pfad "/pdfs" verschwindet, d.h. aus "http://meineurl.com/downloads/SSID/pdfs/document.pdf" soll werden "http://meineurl.com/downloads/[SSID]/document.pdf"

mein ausdruck lautet bisher

Code: Alles auswählen

  pattern = r"(pdfs\w*/)"
  result  = re.sub( pattern, "", result)


leider funktioniert das nicht... Ich schätze mal, es liegt am reg. expr. Kann mir jemand sagen warum bzw. wie ich es richtig machen kann, das wäre echt super.

danke
grüße
BlackJack

Beitragvon BlackJack » Dienstag 19. Juni 2007, 12:14

Was heisst "funktioniert nicht"? Bei mir schon:

Code: Alles auswählen

In [20]: pattern = r'(pdfs\w*/)'

In [21]: url = 'http://meineurl.com/downloads/SSID/pdfs/document.pdf'

In [22]: re.sub(pattern, '', url)
Out[22]: 'http://meineurl.com/downloads/SSID/document.pdf'


Probleme bekommt man aber, wenn 'pdfs' auch als Teilzeichenkette an anderer Stelle auftauchen kann.

Letztendlich braucht man `re` hier aber gar nicht. Ein einfaches `replace()` reicht:

Code: Alles auswählen

In [23]: url.replace('/pdfs/', '/')
Out[23]: 'http://meineurl.com/downloads/SSID/document.pdf'

Wer ist online?

Mitglieder in diesem Forum: Bing [Bot]