Ich bin neu hier und bin seit einigen wenigen Monaten mit Python unterwegs. Mir fehlt daher noch eine ganze Menge an Erfahrung. Nach Studium diverser Seiten und Belegung eines Online-Kurses habe ich mich jetzt in ein kleines Projekt gestürzt. Mein Ziel ist es, öffentlich zugängliche Daten des DWDs für mich aufzubereiten. Ich habe mir daher von einer Messstation die Regendaten heruntergeladen und in Pandas als CSC eingelesen. Die Datenstruktur sieht folgendermaßen aus.
Code: Alles auswählen
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 13200 entries, 0 to 13199
Data columns (total 7 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 STATIONS_ID 13200 non-null int64
1 MESS_DATUM 13200 non-null int64
2 QN_8 13200 non-null int64
3 R1 13200 non-null float64
4 RS_IND 13200 non-null int64
5 WRTR 13200 non-null int64
6 eor 13200 non-null object
dtypes: float64(1), int64(5), object(1)
memory usage: 722.0+ KB
Ich habe dann eine neue Spalte angefügt und aus der Spalte "MESS_DATUM" eine Spalte mit DateTime-Objekten über folgende Code erzeugt:
Code: Alles auswählen
df_hw["MD_DT_neu"] = df_hw["MESS_DATUM"].apply(lambda i: datetime.strptime(str(i)[0:], format("%Y%m%d%H")))
Code: Alles auswählen
df_hw_week = df_hw.groupby(df_hw['MD_DT_neu'].dt.isocalendar().week)
Ich lese seit Tagen, habe aber das Gefühl, dass ich mich immer im Kreis drehe.
Ich wäre für Tipps dankbar.
Liebe Grüße
Thomas