DataFrame filtern mit .contains?
Verfasst: Dienstag 28. April 2020, 11:49
Hallo zusammen,
ich habe ein sehr großes DataFrame mit verschiedenen Informationen unterschiedlicher Standorte in ganz Deutschland.
Ich versuche nun die Daten aus df_daten aus den Regionen, die im DataFrame df_orte hinterlegt sind, einzugrenzen.
Das Dataframe hat eine Spalte "Standorte" mit PLZ+Ort+Straße.
Leider funktioniert es nicht wirklich. Getestet habe ich es mit einem kleineren Dataframe - selbst bei dem es verhältnismäßig lange gedauert und nicht das gewünschte Ergebnis geliefert hat.
danach würde ich gerne mit Hilfe der Indexpositionen aus df_Daten_pos die eingegrenzten Daten in ein DataFrame speichern
ich habe ein sehr großes DataFrame mit verschiedenen Informationen unterschiedlicher Standorte in ganz Deutschland.
Ich versuche nun die Daten aus df_daten aus den Regionen, die im DataFrame df_orte hinterlegt sind, einzugrenzen.
Das Dataframe hat eine Spalte "Standorte" mit PLZ+Ort+Straße.
Leider funktioniert es nicht wirklich. Getestet habe ich es mit einem kleineren Dataframe - selbst bei dem es verhältnismäßig lange gedauert und nicht das gewünschte Ergebnis geliefert hat.
Code: Alles auswählen
# df_daten hat etwa 2 Millionen Zeilen
# df_orte hat etwa 150 Zeilen
for i in range( 0,len(df_daten) ):
for Ortwahl in range( 0,len(df_orte ) ):
df_Daten_pos = df_daten[df_daten['Standort'].str.contains(df_orte.plz[Ortwahl], case=True, na=False)].index.tolist()
print ("Process: " + str(round((i+1)/len(df_test)*100,2)) + " %")
Code: Alles auswählen
df_Daten_eingegrenzt = pd.DataFrame(df_Daten.iloc[df_Daten_pos])