Folgendes Szenario:
Ich habe ein Dataframe. Draus interessieren mich zwei Spalten: Spalte A, Spalte B
Keine der Einträge soll einzigartig sein, weder der Eintrag selbst, noch die Kombination dieser Einträge.
Ziel ist es, zu jedem Ergebnis aus Spalte A die Anzahl der Individuellen Einträge aus Spalte B zu finden. Ich strebe also folgende Struktur an:
Code: Alles auswählen
Value A | Count Value B 1 | Count Value B 2 | Count Value B 3 | ... | Count Value B n
A 1 | 7. | 8 | .......
A 2 | 5. | 18 | .......
Code: Alles auswählen
pd_wanted = pd.pivot_table(df,index=['Value A'], columns=['Value B'],aggfunc={'Value B':'count'})
Code: Alles auswählen
Value B
Value B B1 B2 B3 B4 B5
Value A
123 8043.0 15.0 NaN 1485.0 2540.0
456 15337.0 19.0 NaN 1308.0 3121.0
789 19110.0 3.0 NaN 2325.0 5504.0
534 7046.0 8.0 NaN 335.0 1677.0
Code: Alles auswählen
MultiIndex([('Value B', 'B1'),
('Value B', 'B2'),
('Value B', 'B3')],
names=[None, 'Value B'])
Code: Alles auswählen
Index(['Value A', B1', 'B2', 'B3'],
dtype='object')