Mehrere csv zusammenführen

mit matplotlib, NumPy, pandas, SciPy, SymPy und weiteren mathematischen Programmbibliotheken.
Antworten
TSFER
User
Beiträge: 2
Registriert: Donnerstag 23. Januar 2020, 11:57

Hallo zusammen,

ich bin neu in der Python Welt und scheitere deshalb gerade an einem (vermutlich sehr einfachen) Problem...

Ich habe mehrere .csv Dateien, welche Verschiedene Daten über Unfallbeteiligte beinhalten. Alle Beteiligten haben eine eigene ID. In den Dateien sind in den Spalten jeweils unterschiedliche Dinge beschrieben, die Spalten haben also völlig unterschiedliche Benennungen. Teilweise sind Beteiligte IDs in mehreren Dateien vertreten, teilweise jedoch auch nur in einer. Ich würde gerne aus allen einzelnen Dateien ein großes Dataframe erstellen, in welchem alle Informationen über bspw Beteiligten 1111 gesammelt werden. Wenn über einen Beteiligte nicht für alle Spalten eine Information zur Verfügung steht, soll das Feld einfach leer gelassen werden.

Ich hoffe es ist verständlich, was ich meine :D

Ich habe es jetzt mit .concat versucht. Hierbei sind jedoch nicht alle gleichen IDs zusammengeführt... Leider habe ich aktuell so einen Knoten im Kopf, dass ich nicht weiterkomme... Ich hoffe die Frage ist jetzt nicht allzu dumm, aber ich komme gerade echt nicht weiter :?

Vielen Dank
Benutzeravatar
__blackjack__
User
Beiträge: 14051
Registriert: Samstag 2. Juni 2018, 10:21
Wohnort: 127.0.0.1
Kontaktdaten:

@TSFER: Die ID muss als Index auf den Dataframes gesetzt sein und dann suchst Du `merge()` & Co.
“Vir, intelligence has nothing to do with politics!” — Londo Mollari
Antworten