Hi. Ja, da hab ich beim abschreiben geschusselt. Python mag ja keine Sonderzeichen (ohne coding im IDLE, wobei ich aber zu faul bin, das einzutragen

), deswegen hab ich hier Escapesequenzen genommen. Wenn man das ganze mit einem anderem Editor einträgt geht es natürlich auch ohne die Sequenz.
rogal hat geschrieben:das + steht wohl für einmalig oder mehrmal und bezieht sich auf a-z. das ? einmal oder keinmal auf einen der folgenden umlaute. richtig?
Leider falsch. Das "+?" zählt als ein Zeichen. Dabei gilt folgendes: das + heißt ein- oder mehrmaliges vorkommen von allen Sachen im der Klammer. Das ? sagt dem + aber, es soll trotzdem so wenig wie möglich versuchen mitzunehmen (wäre hier vielleicht unnötig, aber ich habs mir so angewöhnt, weil ich meine RE's meist mit Gruppen spicke und da ist das ganz nützlich). Dazu ein Auszug aus der Docu, der dir das vielleicht verdeutlicht:
Docu hat geschrieben:*?, +?, ??
The "*", "+", and "?" qualifiers are all greedy; they match as much text as possible. Sometimes this behaviour isn't desired; if the RE <.*> is matched against '<H1>title</H1>', it will match the entire string, and not just '<H1>'. Adding "?" after the qualifier makes it perform the match in non-greedy or minimal fashion; as few characters as possible will be matched. Using .*? in the previous expression will match only '<H1>'.
Es können also nach wie vor beliebig viele Umlaute im String enthalten sein, was du dann wie oben gesagt nachprüfen müsstest.
hth, Milan