pandas Mittelwert und Anzahl vorkommen

mit matplotlib, NumPy, pandas, SciPy, SymPy und weiteren mathematischen Programmbibliotheken.
Antworten
owR2K
User
Beiträge: 12
Registriert: Dienstag 28. April 2020, 10:32

Hi,

kann ich mit Pandas auch die Anzahl der Vorkommnisse einer id (erste Spalte) bekommen?

Die Daten sehen so aus:
list = [[id1,wert1.1,wert1.2],[id2, wert2.1, wert2.2]]

Aktuell nutze ich daten = pandas.groupby(0).mean() und normalisiere die Tabelle.

Bei dem groupby werden die Daten mit der gleichen id zusammengefasst, kann ich noch die Anzahl, also wie oft die id in den Ausgangswerten vorkam in eine Spalte bekommen?

mfg
Benutzeravatar
__blackjack__
User
Beiträge: 14045
Registriert: Samstag 2. Juni 2018, 10:21
Wohnort: 127.0.0.1
Kontaktdaten:

@owR2K: Du suchst `count()`?
„A life is like a garden. Perfect moments can be had, but not preserved, except in memory. LLAP” — Leonard Nimoy's last tweet.
owR2K
User
Beiträge: 12
Registriert: Dienstag 28. April 2020, 10:32

Kann count auch nur die Anzahl der doppelten werte geben?

Code: Alles auswählen

 [[id1,x1, y2],
 [id2, x2, y2],
 [id1, x2, y6],
 [id1, x4, y5],...]
Ich möchte die Werte mit id1 wieder zusammenfassen (groupby) und dann die Anzahl der vorkommen (hier 3) mit in der Tabelle haben.

Code: Alles auswählen

[[id1, mittelwert(x1,x2,x4), mittelwert(y6,y5,y2), 3],
[id2, mittelwert(x1,...), mittelwert(y2,...), 1]]
... und dann noch die Mittelwerte jeweils von x und y Spalte normalisiert.

Bisher nutze ich

Code: Alles auswählen

dt=pandas.groupby(0).mean()
und dann noch

Code: Alles auswählen

n_dt=(dt - dt.min())/(dt.max()-dt.min()).
Mit fehlt jetzt die ursprüngliche Anzahl der gleichen ID's.
Antworten