Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
>df['text']
'Das ist text 723453339'
'888453339undein22.1.2020'
'hallo723453339das ist'
'20.2.2020 hallo 723999339'
'beispiel444453339'
'hallo923453339 - d a 30'
Ich bin nur an der 9-stelligen Nummer interessiert. Wie bekomme ich die extrahiert?
Das ist ein `pandas.DataFrame`, da würde ich die `str`-Operationen verwenden die darauf definiert sind. Und man sollte/muss wahrscheinlich auch sicherstellen, dass 10 und mehrstellige Zahlen *nicht* gefunden werden‽
“Vir, intelligence has nothing to do with politics!” — Londo Mollari
__blackjack__ hat geschrieben: Dienstag 13. Juli 2021, 20:11
Das ist ein `pandas.DataFrame`, da würde ich die `str`-Operationen verwenden die darauf definiert sind. Und man sollte/muss wahrscheinlich auch sicherstellen, dass 10 und mehrstellige Zahlen *nicht* gefunden werden‽
Wie würde das aussehen?
__backjack__: "Jemand der VB oder PHP kann, der also was Programmieren angeht irgendwo im negativen Bereich liegt (...)"
Ah, cool. extract() kannte ich bisher nicht. Und das hier ist eindeutig ein Anwendungsfall für reguläre Ausdrücke. Das würde ich nicht Pythons standardmäßigen String-Operationen nachbauen wollen.
@snafu: der OP arbeitet mit Dataframes. Und Dataframes haben verschiedene Stringoperationen definiert, die dann auf alle Elemente einer Spalte angewendet werden. Da sind auch Operationen mit regulären Ausdrücken dabei.