Gewöhnlich ist ein merge so konstruiert:
pd.merge(staff_df, student_df, how='left', left_on='Name', right_on='Full Name')
Aber das funktioniert nur, wenn Full Name und Name Übereinstimmung haben. Was ist aber wenn ich den merge immer dann durchführen will, wenn der Name ein Substring ist von Full Name?
Wie merge ich nach regex?
Das hängt wesentlich davon ab, wie und wie eindeutig die Substrings zu den Fullstrings geordnet werden können... Und: RegExen können eine Möglichkeit sein, aber sie sind in der Regel nicht allzu performant. Vielleicht magst Du etwas umfangreicher und genauer ausführen, was Du vorhast und wie Deine Daten aussehen?Brando hat geschrieben: ↑Dienstag 27. Juli 2021, 20:33 Gewöhnlich ist ein merge so konstruiert:
pd.merge(staff_df, student_df, how='left', left_on='Name', right_on='Full Name')
Aber das funktioniert nur, wenn Full Name und Name Übereinstimmung haben. Was ist aber wenn ich den merge immer dann durchführen will, wenn der Name ein Substring ist von Full Name?
- __blackjack__
- User
- Beiträge: 13236
- Registriert: Samstag 2. Juni 2018, 10:21
- Wohnort: 127.0.0.1
- Kontaktdaten:
Ergänzend zu LukeNukem: Namen können ja auch Teil eines vollen Namens sein an Stellen wo man das so nicht erwartet/haben möchte. Manche Leute haben sogar Nachnamen, die andere als Vornamen haben können.
Please call it what it is: copyright infringement, not piracy. Piracy takes place in international waters, and involves one or more of theft, murder, rape and kidnapping. Making an unauthorized copy of a piece of software is not piracy, it is an infringement of a government-granted monopoly.
Ja, unbedingt. In meinem Bücherregal steht sogar ein Buch von einem Herrn, dessen Nachname 1:1 meinem Vornamen entspricht.__blackjack__ hat geschrieben: ↑Mittwoch 28. Juli 2021, 08:38 Ergänzend zu LukeNukem: Namen können ja auch Teil eines vollen Namens sein an Stellen wo man das so nicht erwartet/haben möchte. Manche Leute haben sogar Nachnamen, die andere als Vornamen haben können.