pandas Mittelwert und Anzahl vorkommen

owR2K · Freitag 4. Februar 2022, 18:51

Hi,

kann ich mit Pandas auch die Anzahl der Vorkommnisse einer id (erste Spalte) bekommen?

Die Daten sehen so aus:
list = [[id1,wert1.1,wert1.2],[id2, wert2.1, wert2.2]]

Aktuell nutze ich daten = pandas.groupby(0).mean() und normalisiere die Tabelle.

Bei dem groupby werden die Daten mit der gleichen id zusammengefasst, kann ich noch die Anzahl, also wie oft die id in den Ausgangswerten vorkam in eine Spalte bekommen?

mfg

__blackjack__ · Freitag 4. Februar 2022, 21:10

@owR2K: Du suchst `count()`?

owR2K · Freitag 4. Februar 2022, 22:08

Kann count auch nur die Anzahl der doppelten werte geben?

Code: Alles auswählen

 [[id1,x1, y2],
 [id2, x2, y2],
 [id1, x2, y6],
 [id1, x4, y5],...]

Ich möchte die Werte mit id1 wieder zusammenfassen (groupby) und dann die Anzahl der vorkommen (hier 3) mit in der Tabelle haben.

Code: Alles auswählen

[[id1, mittelwert(x1,x2,x4), mittelwert(y6,y5,y2), 3],
[id2, mittelwert(x1,...), mittelwert(y2,...), 1]]

... und dann noch die Mittelwerte jeweils von x und y Spalte normalisiert.

Bisher nutze ich

Code: Alles auswählen

dt=pandas.groupby(0).mean()

und dann noch

Code: Alles auswählen

n_dt=(dt - dt.min())/(dt.max()-dt.min()).

Mit fehlt jetzt die ursprüngliche Anzahl der gleichen ID's.