Probleme mit den dezimalzahl daten des csv files
Verfasst: Dienstag 19. Juli 2022, 12:45
Ich möchte mir ein Verständnis für die Daten eines csv files entwickeln. Dazu verwende ich die Methoden df.info(), df.describe() (Funktionen von Pandas) etc.
Leider habe ich das Problem, dass die numerischen Werte des csv files nicht als solches erkannt werden.
Ich glaube, dass es an dem Format der Daten liegt.
Dezimalzahlen werden mit einem Punkt getrennt (z.B. 0.123 oder 42.245 oder 342.12939).
In der selben Datei wird der Punkt aber auch verwendet um die Tausender deutlich zu machen (z.B. 123.432.423.302).
Was ich richtig komisch finde, da man dadurch nicht wirklich erkennen kann wann die Dezimalzahlen beginnen (Man kann dadurch 1000,999 (= Tausend komma neunhundertneunundneunzig) und 1000999 (=Eine Millionen neunhundertneunundneunzig) nicht unterscheiden beide zahlen würde man mit 1.000.999 darstellen ---> seeeeeehr komisch)
Das Problem ist aber auch, dass Pandas die Zahlen über 999 nicht als numerische Werte sondern als Strings erkennt. Damit werden diese Zahlen von der oben genannten Funktionen df.describe ignoriert
Kann mir bitte jemand helfen?
Vielen Dank im Voraus.
Leider habe ich das Problem, dass die numerischen Werte des csv files nicht als solches erkannt werden.
Ich glaube, dass es an dem Format der Daten liegt.
Dezimalzahlen werden mit einem Punkt getrennt (z.B. 0.123 oder 42.245 oder 342.12939).
In der selben Datei wird der Punkt aber auch verwendet um die Tausender deutlich zu machen (z.B. 123.432.423.302).
Was ich richtig komisch finde, da man dadurch nicht wirklich erkennen kann wann die Dezimalzahlen beginnen (Man kann dadurch 1000,999 (= Tausend komma neunhundertneunundneunzig) und 1000999 (=Eine Millionen neunhundertneunundneunzig) nicht unterscheiden beide zahlen würde man mit 1.000.999 darstellen ---> seeeeeehr komisch)
Das Problem ist aber auch, dass Pandas die Zahlen über 999 nicht als numerische Werte sondern als Strings erkennt. Damit werden diese Zahlen von der oben genannten Funktionen df.describe ignoriert
Kann mir bitte jemand helfen?
Vielen Dank im Voraus.