Gewöhnlich ist ein merge so konstruiert:
pd.merge(staff_df, student_df, how='left', left_on='Name', right_on='Full Name')
Aber das funktioniert nur, wenn Full Name und Name Übereinstimmung haben. Was ist aber wenn ich den merge immer dann durchführen will, wenn der Name ein Substring ist von Full Name?
Wie merge ich nach regex?
Das hängt wesentlich davon ab, wie und wie eindeutig die Substrings zu den Fullstrings geordnet werden können... Und: RegExen können eine Möglichkeit sein, aber sie sind in der Regel nicht allzu performant. Vielleicht magst Du etwas umfangreicher und genauer ausführen, was Du vorhast und wie Deine Daten aussehen?Brando hat geschrieben: Dienstag 27. Juli 2021, 20:33 Gewöhnlich ist ein merge so konstruiert:
pd.merge(staff_df, student_df, how='left', left_on='Name', right_on='Full Name')
Aber das funktioniert nur, wenn Full Name und Name Übereinstimmung haben. Was ist aber wenn ich den merge immer dann durchführen will, wenn der Name ein Substring ist von Full Name?
- __blackjack__
- User
- Beiträge: 14189
- Registriert: Samstag 2. Juni 2018, 10:21
- Wohnort: 127.0.0.1
- Kontaktdaten:
Ergänzend zu LukeNukem: Namen können ja auch Teil eines vollen Namens sein an Stellen wo man das so nicht erwartet/haben möchte. Manche Leute haben sogar Nachnamen, die andere als Vornamen haben können.
“Every thinking person fears nuclear war and every technological nation plans for it. Everyone knows
it's madness, and every country has an excuse.” — Carl Sagan, Cosmos, Episode 13: Who Speaks for Earth?
it's madness, and every country has an excuse.” — Carl Sagan, Cosmos, Episode 13: Who Speaks for Earth?
Ja, unbedingt. In meinem Bücherregal steht sogar ein Buch von einem Herrn, dessen Nachname 1:1 meinem Vornamen entspricht.__blackjack__ hat geschrieben: Mittwoch 28. Juli 2021, 08:38 Ergänzend zu LukeNukem: Namen können ja auch Teil eines vollen Namens sein an Stellen wo man das so nicht erwartet/haben möchte. Manche Leute haben sogar Nachnamen, die andere als Vornamen haben können.
