ich lerne gerade pandas kennen und hab ein konkretes Problem welches ich nicht gelöst bekomme. Würde mich sehr über Lösungsansätze und ggf. ein paar Tipps freuen:
PROBLEM: Es gibt eine *.csv Datei mit 3 Spalten und einigen Zeilen:


WUNSCH:
Nach der Verarbeitung soll die *.csv wie folgt aussehen:

Ich versuche es mit Pandas zu lösen und lese die Datei in das DataFrame ein.
Code: Alles auswählen
import pandas as pd
df = pd.read_csv("./meinecsv.csv", usecols=(0, 1, 2), sep=";" , decimal="." , encoding="utf-8")
ff = df.groupby(['Artikelname'],as_index = False).fillna('Y').pivot('Artikelname','Farbe').fillna('x')
Allerdings habe ich so meine Zweifel ob der Lösungsansatz richtig ist. Was mich z.B. stört ist das z.B. die Farbe keine "Ganzzahlen" sind.
Gibt es ggf. eine Funktion die mir genau diese Aufgabe abnehmen kann? Sowas wie .mean oder .sum. Leider hab ich nicht passendes in der Doku gefunden.
Ansonsten dachte ich noch über den folgenden Weg nach:
Code: Alles auswählen
with open("./meinecsv.csv") as file:
for pos in file:
data = pos.strip().split(",")
data

So und ab hier fehlt mir leider die richtige Idee

Freue mich über jede Anregung. Vielen Dank im voraus.