IDs miteinander verknüpfen
Verfasst: Dienstag 7. September 2021, 13:17
Hallo miteinander,
ich muss wieder einmal IDs vergleichen (ähnlich viewtopic.php?f=30&t=52746). Nur brauche ich in diesen Fall alle "verknüpften" IDs in eine art Tabelle.
Denn später soll nur diese eine Tabelle geladen werden (z.B. als csv-Datei gespeichert) und anhand dessen Datei(-namen) oder Spalten in wieder anderen Dateien zugeordnet werden.
Hier ein Minimalbeispiel:Statt "Blackbox" habe ich mich mit Schleifen versucht. Da die Dateien aber durchaus 1 Mio. oder mehr Zeilen haben können, würde das Ausführen Tage dauern.
Ich hoffe die Zuordnung ist klar?
Das Ergebnis (Variable: index_energy) kann auch (programmiertechnisch: Liste, Dataframe, dic, ...) anders gestalten sein. Es muss nur klar die ID zuordenbar sein.
Es werden aus vielen verschiedenen Programmen Dateien ausgegeben, in welche "verknüpfte Werte" miteinander verglichen werden sollen.
Wie kann man die Blackbox ohne Schleifen gestallten?
Vielen Dank.
ich muss wieder einmal IDs vergleichen (ähnlich viewtopic.php?f=30&t=52746). Nur brauche ich in diesen Fall alle "verknüpften" IDs in eine art Tabelle.
Denn später soll nur diese eine Tabelle geladen werden (z.B. als csv-Datei gespeichert) und anhand dessen Datei(-namen) oder Spalten in wieder anderen Dateien zugeordnet werden.
Hier ein Minimalbeispiel:
Code: Alles auswählen
import pandas as pd
energy_heat = {'ID_old_one': ['id01', 'id02', 'id03'], 'ID_old_two': ['id05', 'id04', 'id07'], 'apfel': [5, 13, 18]}
df_energy_heat = pd.DataFrame(data=energy_heat)
df_energy_heat
energy_sun = {'ID_old_one': ['id09', 'id04', 'id05'], 'ID_old_two': ['id03', 'id06', 'id07'], 'birne': [17, 3, 12]}
df_energy_sun = pd.DataFrame(data=energy_sun)
df_energy_sun
### ... Blackbox ...
index_energy = {'ID_new': ['id0a', 'id0b'], 'ID_old': [['id01','id05', 'id07', 'id08', 'id09'], ['id02', 'id04', 'id06']]}
df_index_energy = pd.DataFrame(data=index_energy)
df_index_energy
energy_heat = {'ID_new': ['id0a', 'id0b', 'id0a'], 'apfel': [5, 13, 18]}
df_energy_heat = pd.DataFrame(data=energy_heat)
df_energy_heat
energy_sun = {'ID_new': ['id0a', 'id0b', 'id0a'], 'birne': [17, 3, 12]}
df_energy_sun = pd.DataFrame(data=energy_sun)
df_energy_sun
Ich hoffe die Zuordnung ist klar?
Das Ergebnis (Variable: index_energy) kann auch (programmiertechnisch: Liste, Dataframe, dic, ...) anders gestalten sein. Es muss nur klar die ID zuordenbar sein.
Es werden aus vielen verschiedenen Programmen Dateien ausgegeben, in welche "verknüpfte Werte" miteinander verglichen werden sollen.
Wie kann man die Blackbox ohne Schleifen gestallten?
Vielen Dank.