wie schon gesagt hab ich ein problem mit einem regex...
ich würde gern urls von einer news-webseite auslesen.
die urls haben immer den gleichen aufbau und unterscheiden sich nur nach dem letzten slash...
deshalb hab ich versucht einfach den letzten teil der url mit einem regex suchen zu lassen.
Code: Alles auswählen
url = re.compile('[a-z]+?-\d\d\.\d\d\.\d\d-\d\d\d')
2-3 buchstaben, ein minuszeichen, gefolgt von dem aktuellen datum z.b. 02.03.03, dann wieder ein minus, gefolgt von 3 zahlen.)
das funktioniert soweit auch ganz gut....
allerdings bekomme ich als ausgabe immer die komplette zeile in der der ausdruck enthalten ist
und nicht NUR den ausdruck nach dem ich suche...
wie schaffe ich es das nur der ausdruck nach dem ich suche zurück gegeben wird?
gruß
günni