Aggregieren von Dataframe mit zeilenweisem prüfen

mit matplotlib, NumPy, pandas, SciPy, SymPy und weiteren mathematischen Programmbibliotheken.
Antworten
lambkin
User
Beiträge: 17
Registriert: Dienstag 22. Mai 2018, 08:29

Hi zusammen,

ich versuche es in der Forumsgruppe für Panda etc nochmal:

Mein Dataframe:
Projektnr | Teilprojektnr | Abteilung | Mitarbeiter |
1 | a | A | 1
1 | a | B | 1
1 | a | C | 2
1 | b | A | 1
1 | b | B | 1
2 | c | A | 3

Mein Ziel:
Projektnr | Anzahl Teilprojektnur | Anzahl Abteilungen | max Mitarbeiter
1 | 2 | 5 | 2
2 | 1 | 1 | 3

Wie kann ich mittels pandas denn erreichen, dass ich den Dataframe zeilenweise durchgehe und die Anzahl der unterschiedlichen(!) Teilprojektnummern zu einer Projektnummer aggregiere?
Folgendes habe ich empfohlen bekommen, das funktioniert soweit auch, nur kann ich es nicht auf mein Dataframe anwenden.

Code: Alles auswählen

gruppiert = df.groupby(['Projektnummer'])
for name, group in gruppiert:
    zeile = name,len(group['Teilprojektnummer'].unique())
    print(zeile)
Ich hatte gehofft, dass ich das direkt auf meinen Dataframe anwenden kann, so in Richtung:

Code: Alles auswählen

gruppiert = df.groupby("bündelnummer").agg({"sachnummer": FEHLENDE FUNKTION, "gsbereich":["count"], "MG":["max"]})
habt ihr noch Vorschläge, wie man das ganze schön machen kann?

Grüße
lambkin
Antworten