Probleme mit unvollständigen Datumswerten in CSV
Verfasst: Dienstag 14. Oktober 2025, 13:15
Hey zusammen,
bin eigentlich JS-Dev, aber auf dem aktuellen Projekt muss ich ne ziemlich große CSV mit Investment-Daten analysieren. Hab das in Colab mit Python gemacht, bisschen rumprobiert mit pandas, aber ehrlich gesagt... kaum Plan davon. Das CSV hat so 80k Zeilen, aber manche Zeilen haben kein komplettes Datum – manchmal fehlt das Jahr, manchmal nur der Monat. Wollte das auffüllen mit irgendwas Standardmäßigem, aber die Formatierung bricht mir alles.
Das fillna(method="ffill") macht zwar was, aber bei Datumsangaben wie 03-15 ohne Jahr kommt nur NaT. Hatte versucht, einfach 2024- vorne dran zu hängen mit nem apply(lambda x: ...), aber dann hab ich plötzlich Strings und datetime durcheinander. Brauch ne simple Lösung, wie man so halb kaputte Datumsfelder aufräumt, ohne dass alles explodiert.
Danke schon mal!
bin eigentlich JS-Dev, aber auf dem aktuellen Projekt muss ich ne ziemlich große CSV mit Investment-Daten analysieren. Hab das in Colab mit Python gemacht, bisschen rumprobiert mit pandas, aber ehrlich gesagt... kaum Plan davon. Das CSV hat so 80k Zeilen, aber manche Zeilen haben kein komplettes Datum – manchmal fehlt das Jahr, manchmal nur der Monat. Wollte das auffüllen mit irgendwas Standardmäßigem, aber die Formatierung bricht mir alles.
Code: Alles auswählen
import pandas as pd
df = pd.read_csv("invest_data.csv")
df["date"] = pd.to_datetime(df["date"], errors="coerce")
df["date"] = df["date"].fillna(method="ffill")
print(df.head(10))
Danke schon mal!