Optimales Dataframe für verschachtelten Datensatz

mit matplotlib, NumPy, pandas, SciPy, SymPy und weiteren mathematischen Programmbibliotheken.
Antworten
lvlanson
User
Beiträge: 7
Registriert: Mittwoch 7. April 2021, 14:02

Mittwoch 7. April 2021, 14:07

Hey,

ich habe hier einen für mein bisheriges Arbeiten ungewöhnlichen Datensatz. Es gibt unterschiedliche Testreihen, wobei jede Testreihe noch Attribute hat (Label, Label Fehler). Jede Testreihe besteht aus verschiedenen Attributen die über Zeitstempel aufgenommen worden sind. Für mich stellt sich die Frage, was eine optimale Struktur für ein Dataframe ist.

Ziel ist es das Dataframe dann in einer Datei zu sichern, sodass es immer wieder aufgerufen werden kann. Derzeit liegen die Daten in einer hdf5 Datei vor, sind aber eben durch die Natur des Formats nicht so schön lesbar wie in einem DataFrame. Der Datensatz ist ca. 250mb groß. Daher möchte ich die Konvertierung persistieren.

Ich habe eine Grafik angefertigt, die den Aufbau des Datensatzes verbildlicht.

Bild

Was würdet ihr empfehlen hier zu tun?
Antworten