Workflow Datenanalyse von unbekannter Tabelle

mit matplotlib, NumPy, pandas, SciPy, SymPy und weiteren mathematischen Programmbibliotheken.
Antworten
naheliegend
User
Beiträge: 439
Registriert: Mittwoch 8. August 2018, 16:42

Hi,

mal angenommen ihr bekommt einfach eine .csv, .txt oder eine .zip Datei vorgegeben und ihr sollt jetzt zusehen, dass ihr damit irgendwas macht.

Wie findet ihr heraus, wie die Datein oder Tabellen aufgebaut sind? Bzw habt ihr irgendwie Schritte, die ihr immer ausübt um am Ende des Tages die ganze Tabelle ordentlich strukturiert in NumPy arrays oder als pandas dataframe in Python bekommt? Was sind so die gängigsten Befehle?

Ich dachte ich frage mal erfahrene Leute, bevor ich mich nach Befehlen dumm und dämlich google.

Viele Grüße und Danke.
__backjack__: "Jemand der VB oder PHP kann, der also was Programmieren angeht irgendwo im negativen Bereich liegt (...)"
Sirius3
User
Beiträge: 17748
Registriert: Sonntag 21. Oktober 2012, 17:20

Naja, man will ja nicht irgendwas machen, sondern hat ein ganz konkretes Problem. Und die Dateien schaut man zuerst mit einem ganz normale Editor an.
naheliegend
User
Beiträge: 439
Registriert: Mittwoch 8. August 2018, 16:42

Okey danke. Aber wenn ich z.B. ein .gz File habe, was ich irgendwie nicht so recht öffnen kann. Woher weiß ich, wie ich damit umgehen muss?
__backjack__: "Jemand der VB oder PHP kann, der also was Programmieren angeht irgendwo im negativen Bereich liegt (...)"
__deets__
User
Beiträge: 14538
Registriert: Mittwoch 14. Oktober 2015, 14:29

Gz ist ein Kompressionsformat. Das kann man mit Python bordmitteln einlesen.
Antworten