groupby mit Bedingung

st_baum · Samstag 12. September 2020, 10:22

Mittels


df.groupby('industry')['employment'].mean()

kann ich mir die durchschnittliche Anzahl der Beschäftigten ('employment') in jeder 'industry' bestimmen lassen. Ich möchte den Befehl so erweitern, dass ich noch eine Bedingungen einführen kann. Es sollen nur die 'industry' in bestimmten 'country' herangezogen werden.

Wie löse ich das am elegantesten? Ich kann natürlich den df so filtern, dass ich nur die jeweiligen 'country' im dataframe behalte, erscheint mir aber nicht so richtig sauber.

Sirius3 · Samstag 12. September 2020, 10:27

Doch, das ist sauber. Erst filtern dann gruppieren.

st_baum · Samstag 12. September 2020, 15:28

Um sicher zu gehen, hier ein Vorschlag:

Code: Alles auswählen

df_filtered = df[(df['country'] == 'germany')]
df_filtered.groupby('industry')['employment'].mean()

Ist ein sauberes Vorgehen?

DeaD_EyE · Samstag 12. September 2020, 16:42

Für mich als nicht-pandas-Nutzer sieht das sauber aus.