Duplikate aus DataFrame löschen und Menge aufsummieren

mit matplotlib, NumPy, pandas, SciPy, SymPy und weiteren mathematischen Programmbibliotheken.
Antworten
MacGruber
User
Beiträge: 63
Registriert: Sonntag 28. Mai 2017, 13:04

Moinsen,

ich habe einen DataFrame mit 3 Spalten.
Komponente
Menge
Mengeneinheit (Stück, Meter, Liter,...)

In der Spalte Komponente stehen die selben Komponenten leider mehrfach drinne. Ich möchte eine duplikatfreie Auflistung haben in der die Mengen der einzelnen Einträge aufsummiert werden. Hier ein Beispiel:

Komponente; Menge; Mengeneinheit
Schraube; 3; St
Bolzen; 2; St
Öl; 2.5; Liter
Schraube; 5; St

wird zu...

Komponente; Menge; Mengeneinheit
Schraube; 8; St
Bolzen; 2; St
Öl; 2.5; Liter

Ich habe vorab schon gegooglet und im Forum gesucht, aber die richtige Suchanfrage ist mir nicht eingefallen. Eure Hilfe würde mich freuen :)

Gruß Sascha
MacGruber
User
Beiträge: 63
Registriert: Sonntag 28. Mai 2017, 13:04

Noch als Ergänzung:
Ich habe mit der Funktion Drop_Duplikates mich versucht. Das entfernen der überflüssigen Zeilen ist kein Problem, aber ich habe keinen Parameter gefunden mit dem ich Spalten zum Aufsummieren angeben kann.
Benutzeravatar
__blackjack__
User
Beiträge: 14047
Registriert: Samstag 2. Juni 2018, 10:21
Wohnort: 127.0.0.1
Kontaktdaten:

Nach Komponente gruppieren und aufsummieren. Mengeneinheit würde ich da vorher entfernen und hinterher wieder hinzufügen beziehungsweise wenn es verschiedene Einheiten für die Komponente geben kann, muss das zum Gruppierungskriterium dazu kommen.
“Vir, intelligence has nothing to do with politics!” — Londo Mollari
MacGruber
User
Beiträge: 63
Registriert: Sonntag 28. Mai 2017, 13:04

Danke! Hat geklappt. :)
Antworten