Seite 1 von 1

Workflow Datenanalyse von unbekannter Tabelle

Verfasst: Samstag 25. April 2020, 20:02
von naheliegend
Hi,

mal angenommen ihr bekommt einfach eine .csv, .txt oder eine .zip Datei vorgegeben und ihr sollt jetzt zusehen, dass ihr damit irgendwas macht.

Wie findet ihr heraus, wie die Datein oder Tabellen aufgebaut sind? Bzw habt ihr irgendwie Schritte, die ihr immer ausübt um am Ende des Tages die ganze Tabelle ordentlich strukturiert in NumPy arrays oder als pandas dataframe in Python bekommt? Was sind so die gängigsten Befehle?

Ich dachte ich frage mal erfahrene Leute, bevor ich mich nach Befehlen dumm und dämlich google.

Viele Grüße und Danke.

Re: Workflow Datenanalyse von unbekannter Tabelle

Verfasst: Samstag 25. April 2020, 20:07
von Sirius3
Naja, man will ja nicht irgendwas machen, sondern hat ein ganz konkretes Problem. Und die Dateien schaut man zuerst mit einem ganz normale Editor an.

Re: Workflow Datenanalyse von unbekannter Tabelle

Verfasst: Sonntag 26. April 2020, 07:30
von naheliegend
Okey danke. Aber wenn ich z.B. ein .gz File habe, was ich irgendwie nicht so recht öffnen kann. Woher weiß ich, wie ich damit umgehen muss?

Re: Workflow Datenanalyse von unbekannter Tabelle

Verfasst: Sonntag 26. April 2020, 08:47
von __deets__
Gz ist ein Kompressionsformat. Das kann man mit Python bordmitteln einlesen.