Das deutsche Python-Forum

Hallo,

ich habe eine String mit variabler Länge und ohne Whitepsaces, bei dem ich testen möchte, ob er mit exakt vier Zahl aufhört.

Mit

Code: Alles auswählen

re.match('\d{4}$',string)

funktioniert es nicht, weil das auf 'abcd01234' genau so passt wie auf 'abcd012345'.

Gruß, noisefloor

Dann sag dem RegExp, dass er vor den Zahlen nur Buchstaben akzeptieren soll

Besser nichtzahl:

Code: Alles auswählen

re.match('\D?\d{4}$',string)

Das dürfte auch nicht richtig funktionieren, da die Regex nur Strings der Länge 4 und 5 matcht.

Code: Alles auswählen

>>> print re.match('\D?\d{4}$', 'ab1234')
None

Mein Vorschlag:

Code: Alles auswählen

>>> reg = re.compile('(?:^|\D)(\d{4}$)')
>>> reg.search('ab1234').group(1)
'1234'
>>> print reg.search('ab12345')
None

MfG
HWK

Hallo,

irgendwas funktioniert nicht... und ich verstehe es nicht...

Code: Alles auswählen

text1 = 'abc12345'
text2 = 'abc1234'

re.match('\D?\d{4}$',text1)
#es wird kein match-Objekt zurückgegeben
re.match('\D?\d{4}$',text2)
#es wird kein match-Objekt zurückgegeben
re.search('\D?\d{4}$',text1)
#gibt ein match-Objekt
re.search('\D?\d{4}$',text2)
#gibt ein match-Objekt

EDIT: habe gerade erst das letzte Posting von HWK gelesen... werde ich mal probieren.

Gruß, noisefloor

Könntest auch eine eigene kleine Funktion ohne RegExes schreiben, in der Du die letzten vier Stellen jeweils mit ".isdigit()" überprüfst.

Gruß

problembär hat geschrieben:Könntest auch eine eigene kleine Funktion ohne RegExes schreiben, in der Du die letzten vier Stellen jeweils mit ".isdigit()" überprüfst.

Gruß

Die davor sollen aber ja grad keine Digits sein!

Hallo,

Könntest auch eine eigene kleine Funktion ohne RegExes schreiben,

Klar, kann man. Aber man muss ja mindestens 2x slicen, um das zu testen. Geht, ist aber nicht elegant.

Gruß, noisefloor

@noisefloor: Einmal "slicen" reicht. Bei dem was vor den letzten vier Zeichen steht interessiert ja nur *ein* Zeichen -- dafür muss man nicht "slicen".

Wenn man es in reinem Python schreiben möchte, dürfte dies alle Fälle abdecken:

Code: Alles auswählen

len(s) >= 4 and s[-4:].isdigit() and not s[-5:-4].isdigit()

Den letzten Slice mache ich so, weil er einen leeren String ergibt, wenn nur 4 Zeichen vorhanden sind und ich damit einen IndexError umgehe.

Code: Alles auswählen

import re

def s(s):
    return bool(re.search(r"(^|\D)\d{4}$", s))

assert s("1234")
assert not s("123")
assert not s("11234")

assert s("abc1234")
assert not s("abc123")
assert not s("abc11234")

Stefan

@sma: Entspricht das nicht dem, was ich bereits vorgeschlagen habe?
MfG
HWK

HWK hat geschrieben:@sma: Entspricht das nicht dem, was ich bereits vorgeschlagen habe?

Weitestgehend. Ich habe keine Gruppen. Manchmal schreibe ich Postings offline und/oder lese nicht alle Beiträge sorgfältig genug, um zu bemerken, dass mittlerweile mein Posting obsolete geworden ist. Und manchmal denke ich mir auch einfach, wenn ich's schon geschrieben habe, kann ich's auch posten. Das ist dann nicht als Kritik der vorherigen Beiträge zu werden.

Stefan

sma hat geschrieben:Ich habe keine Gruppen.

Doch: (^|\D).
Den Rest bei mir habe ich nur zugefügt, weil ich nicht wusste, ob der OP die letzten 4 Ziffern noch weiter verwenden will.
Ich habe Deinen Post auch nicht als Kritik aufgefasst, wollte Dich aber trotzdem auf das Überlesen meines Posts aufmerksam machen.

MfG
HWK

Was meint denn `(^|\D)`.
Also \D ist klar, aber ich verstehe hier denn Sinn von ^ gerade nicht.

jbs hat geschrieben:Was meint denn `(^|\D)`.
Also \D ist klar, aber ich verstehe hier denn Sinn von ^ gerade nicht.

Damit eine vierstellige Zahl am Anfang des Strings akzeptiert wird.

Code: Alles auswählen

In [2]: import re

In [3]: re.match(r"^\d{4}$", "1234")
Out[3]: <_sre.SRE_Match object at 0x012FC3A0>

In [4]: re.match(r"\D\d{4}$", "1234")
In [5]:

Das deutsche Python-Forum

exakte Länge mit RegEx feststellen

exakte Länge mit RegEx feststellen