ich möchte folgendes in Python umsetzen.
Ich lese eine CSV-Datei mit Datum, Land, und Anzahl Patienten. Vorsicht: Unsortiert und Lücken in den Daten (fehlt zwischendurch mal ein Tag)
Code: Alles auswählen
date,country,patients
2020-01-02,germany,0
2020-01-04,swiss,0
2020-01-06,germany,5
2020-01-01,germany,0
2020-01-03,germany,1
2020-01-05,swiss,0
2020-01-03,france,0
2020-01-07,swiss,5
2020-01-05,germany,4
2020-01-02,france,0
Ergebnis etwa so: (ob sortiert oder unsortiert spielt keine Rolle)
Code: Alles auswählen
date,country,patients,day
2020-01-02,germany,0
2020-01-04,swiss,0
2020-01-06,germany,5,4
2020-01-01,germany,0
2020-01-03,germany,1,1
2020-01-05,swiss,0
2020-01-03,france,0
2020-01-07,swiss,5,1
2020-01-05,germany,4,3
2020-01-02,france,0
Code: Alles auswählen
import pandas as pd
# Read data from file
data = pd.read_csv("data.csv")
data.head(10)
Problematik aus meiner Sicht:
- Sortieren der Daten nach Datum
- Fortlaufende Tagesbezeichnung je Land
- Das mitzählen nicht vorhandener Tage im Datensatz
Jonas