Aggregieren von Dataframe mit zeilenweisem prüfen
Verfasst: Montag 18. Juni 2018, 15:01
Hi zusammen,
ich versuche es in der Forumsgruppe für Panda etc nochmal:
Mein Dataframe:
Projektnr | Teilprojektnr | Abteilung | Mitarbeiter |
1 | a | A | 1
1 | a | B | 1
1 | a | C | 2
1 | b | A | 1
1 | b | B | 1
2 | c | A | 3
Mein Ziel:
Projektnr | Anzahl Teilprojektnur | Anzahl Abteilungen | max Mitarbeiter
1 | 2 | 5 | 2
2 | 1 | 1 | 3
Wie kann ich mittels pandas denn erreichen, dass ich den Dataframe zeilenweise durchgehe und die Anzahl der unterschiedlichen(!) Teilprojektnummern zu einer Projektnummer aggregiere?
Folgendes habe ich empfohlen bekommen, das funktioniert soweit auch, nur kann ich es nicht auf mein Dataframe anwenden.
Ich hatte gehofft, dass ich das direkt auf meinen Dataframe anwenden kann, so in Richtung:
habt ihr noch Vorschläge, wie man das ganze schön machen kann?
Grüße
lambkin
ich versuche es in der Forumsgruppe für Panda etc nochmal:
Mein Dataframe:
Projektnr | Teilprojektnr | Abteilung | Mitarbeiter |
1 | a | A | 1
1 | a | B | 1
1 | a | C | 2
1 | b | A | 1
1 | b | B | 1
2 | c | A | 3
Mein Ziel:
Projektnr | Anzahl Teilprojektnur | Anzahl Abteilungen | max Mitarbeiter
1 | 2 | 5 | 2
2 | 1 | 1 | 3
Wie kann ich mittels pandas denn erreichen, dass ich den Dataframe zeilenweise durchgehe und die Anzahl der unterschiedlichen(!) Teilprojektnummern zu einer Projektnummer aggregiere?
Folgendes habe ich empfohlen bekommen, das funktioniert soweit auch, nur kann ich es nicht auf mein Dataframe anwenden.
Code: Alles auswählen
gruppiert = df.groupby(['Projektnummer'])
for name, group in gruppiert:
zeile = name,len(group['Teilprojektnummer'].unique())
print(zeile)
Code: Alles auswählen
gruppiert = df.groupby("bündelnummer").agg({"sachnummer": FEHLENDE FUNKTION, "gsbereich":["count"], "MG":["max"]})
Grüße
lambkin