Ich bin zurzeit dabei ein wenig mit findall rumzuprobieren, und habe auch einige Testscripts da, aber leider sind mir nicht alle Operatoren klar.
So wie ich es bis jetzt verstanden habe, müsste doch eigentlich
Code: Alles auswählen
print(re.findall(r"(?:[w,W])+.(?:[a-zA-Z])+.(?:[a-z])+|/|(?:[a-zA-Z])+.(?:[a-z])+]"," http://www.python.de und http://www.python.org/index.php und index.php oder http://WWW.python.org oder test"))
aber es gibt mir nur folgendes aus: ['www.python.de', 'www.python.org', '/', 'WWW.python.org']
Das kann ja eigentlich nur an den Falsch verstandenen Operatoren liegen oder?
Was tut z.B.: (?:[blabla])+ das bewirkt doch nur dass die Zeichenfolge öfters vorhanden sein darf oder?
Und was tut | ?
und Warum bekomme ich / als output. Das macht für mich keinen Sinn, da es am Anfang kein WWWW oder www hat.
Naja ich hoffe ihr versteht mein problem und könnt mir die wichtigsten Operatoren in findall erklären, denn bei google habe ich immer nur Testscripts gefunden, die zwar geholfen haben, aber nur zum bewältigen des Problems und nicht zum verstehen.
Danke schonmal