Das ist mit allen probierten Methoden immer irgendwie problematisch
Ich wähnte mich am ziel als ich einen vermeinlich universellen regex-Ausdruck fand, der mir hilft alle möglichen Datumsformate zu entschlüsseln
mit diesem Codefragment wnalde ich alle gefundenen Daten in datetime um:
Code: Alles auswählen
re.MULTILINE
for r in DATE_REGEX:
for m in re.finditer(r, text):
try:
xx=parser.parse(m.group(0))
if xx.year>2026:
xx=xx-relativedelta(years=100)
Die Datumsangabe "10.3.88" (März) wird zu "3.10.1988" im datetime-Objekt geparst - der rest schlögt dann natürlich fehl
Ich kriege in den zu durchsuchenden texten leider alle möglichen Angaben. Da es deutsche texte sind, überiwegen zumindest die deutschen varianten - so auch hier.
Ausnahme ist eine neue Arthroskopie-Einheit die das Datum jeweils im ISO-Format angibt YYYY-MM-DD, aber auch YYYY/MM/DD
Gibt es da eine bessere Variante?