wie geschickt Daten aus C++-Programm weiterverarbeiten
Verfasst: Donnerstag 3. August 2006, 21:31
Hallo
Ich habe in einem C++-Programm eine recht krude Datenstruktur. Die besteht aus drei ineinander verschachtelten Maps.
Diese Rohdaten möchte ich gern in eine (oder mehrere) Dateien abspeichern.
Anschließend sollen - je nach Bedarf - die Dateien später eingelesen und verarbeitet werden. Diese Verarbeitung soll die aus den Dateien nur einige Teile filtern und diese Teile dann im CSV-Format abspeichern.
Da kam mir die Idee, das in einem Python-Skript zu machen, weil ein solches Skript bereits die Ausführung des Programmsdas die Rohdaten erzeugt steuert.
Ich frage mich, wie ich da am geschicktesten die Rohdaten abspeichere um sie möglichst einfach in Python verarbeiten zu können.
Der logische Aufbau der Rohdaten ist dieser hier:
Dabei gibt es zwischen 1 und ~10000 verschiedene Values für Oberkategorie. Pro Value davon gibt es dann zwischen 1 und ~10000 verschiedene Values der Zwischenkategorie und für jeden davon gibt es dann wiederum zwischen 1 und ~50000 Values der Unterkategorie.
Meine Idee war jetzt etwa diese:
ID1 = ID für Oberkategorie
ID2 = ID für Zwischenkategorie
ID3 = ID für Unterkategorie
Dann dem Python-Skript mitteilen, welche Bereiche von ID1, ID2 und ID3 benötigt werden und diese werden dann passend in eine Datei im CSV-Format geschrieben.
Ist das ein gangbarer Weg ? Oder hat jemand spontan eine bessere Idee ?
Ich danke euch !
Ich habe in einem C++-Programm eine recht krude Datenstruktur. Die besteht aus drei ineinander verschachtelten Maps.
Diese Rohdaten möchte ich gern in eine (oder mehrere) Dateien abspeichern.
Anschließend sollen - je nach Bedarf - die Dateien später eingelesen und verarbeitet werden. Diese Verarbeitung soll die aus den Dateien nur einige Teile filtern und diese Teile dann im CSV-Format abspeichern.
Da kam mir die Idee, das in einem Python-Skript zu machen, weil ein solches Skript bereits die Ausführung des Programmsdas die Rohdaten erzeugt steuert.
Ich frage mich, wie ich da am geschicktesten die Rohdaten abspeichere um sie möglichst einfach in Python verarbeiten zu können.
Der logische Aufbau der Rohdaten ist dieser hier:
Code: Alles auswählen
Oberkategorie: Value
Zwischenkategorie: Value
Unterkategorie: Key, Value
Meine Idee war jetzt etwa diese:
ID1 = ID für Oberkategorie
ID2 = ID für Zwischenkategorie
ID3 = ID für Unterkategorie
Code: Alles auswählen
ID1=0
ID2=0
ID3=0
ID3=1
...
ID2=1
ID3=0
...
ID1=1
ID2=0
ID3=0
ID3=1
ID2=1
ID3=0
ID3=2
...
Ist das ein gangbarer Weg ? Oder hat jemand spontan eine bessere Idee ?
Ich danke euch !