ich wollte mal fragen, wie man mithilfe der set() Funktion alle Duplikate in einer Spalte eines Dataframes löschen kann.
Damit meine ich nicht nur die Duplikate zu löschen, sondern alle Zeichenfolgen, die mehrfach vorkamen.
Mein Ziel ist es alle Kundennummer herauszufiltern, die 2020 neu entstanden sind.
Das heißt, ich will aus meiner Spalte alle anderen Nummern, die in den Jahren davor schon vorkamen rauslöschen, sodass nur noch die von 2020 übrig bleiben.
Code: Alles auswählen
set(df.[df.Jahr <= 2019].Kundennummern)
Allerdings bleiben die Anderen weiterhin bestehen und ich will nur die, die einmal vorkommen und keine Duplikate haben.
Ich hoffe man versteht mein Problem.

Danke auf jeden Fall schon mal im Vorraus!