Probleme mit Regex

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
pythonguy
User
Beiträge: 28
Registriert: Donnerstag 22. November 2007, 18:51

Es geht um folgendes: Ich will alle externe Links von Google, also z.B. die Seite

http://www.google.de/search?hl=de&q=pyt ... uche&meta=

Dazu habe ich den folgenden Code:

Code: Alles auswählen

findall('<h2 class=r><a href=".+" class=l',google)
Der Interpreter spuckt zwar die externe Links aus, allerdings mit den Formatierungen und Descriptions drum herum, kann mir jemand weiterhelfen?
michba
User
Beiträge: 1
Registriert: Freitag 26. Oktober 2007, 18:10

Hi, setze runde Klammern um .+

Code: Alles auswählen

findall('<h2 class=r><a href="(.+)" class=l',google)
schlangenbeschwörer
User
Beiträge: 419
Registriert: Sonntag 3. September 2006, 15:11
Wohnort: in den weiten von NRW
Kontaktdaten:

Code: Alles auswählen

findall('<h2 class=r><a href="(.+?)" class=l',google)
das in runden klammern wird ausgegeben
das ? sorgt für die kleinste gruppe, die passt
pythonguy
User
Beiträge: 28
Registriert: Donnerstag 22. November 2007, 18:51

Super dank, hat mich weitergeholfen :-)
Antworten