Dateien in Python mit Bedingung kombinieren

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
Anuschka889
User
Beiträge: 1
Registriert: Donnerstag 20. Juli 2023, 11:45

Hallo ihr Lieben.
Ich bin Ärztin und wissenschaftliche Mitarbeiterin und somit absoluter Python Newbie und hänge aktuell an (wahrscheinlich für euch kleinem) Problem. Ich möchte zwei Tabellen aus Excel miteinander kombinieren.
Tabelle 1 enthält die Fallnummern (in der Spalte, keine doppelten Fallnummern) und die dazugehörigen Messwerte ab Tag 0 (368 Zeilen bzw. Fallnummern).
Tabelle 2 erhält die Fallnummern und eine Spalte mit "Survival ja/nein" (415 Fallnummern/Zeilen).
Tabelle 2 enthält also mehr Fallnummern, der Großteil stimmt aber mit Tabelle 1 überein.
Wie fusioniere ich die Tabellen also und schmeiße die Fallnummern raus, die nicht doppelt aufgeführt sind?
Ich habe es bereits mit der Python Funktion concat probiert, aber dann verschieben sich die Zeilen und die Zuordnung der Daten stimmt nicht mehr. Ich müsste es doch irgendwie noch an eine Bedingung knüpfen, oder?
Kann mir jemand helfen?
Vielen Dank im Voraus!
Anuschka
derElch
User
Beiträge: 36
Registriert: Sonntag 25. Februar 2018, 13:14

Hallo Anuschka,

Verarbeitest du die kombinierte Excel Liste dann weiter mit Python?

Ansonsten wenn du die Daten schon im Excel hast schau dir Tabellen Abfragen in Excel dann Excel kann das nämlich auch ;)
Benutzeravatar
__blackjack__
User
Beiträge: 13998
Registriert: Samstag 2. Juni 2018, 10:21
Wohnort: 127.0.0.1
Kontaktdaten:

@Anuschka889: Da Du `concat()` erwähnst, kann man jetzt raten, dass Du wohl Pandas benutzt. Das ist keine „Python Funktion“, sondern eine Funktion in dieser Bibliothek.

Pandas hat eine ziemlich gute und ausführliche Dokumentation. Und diesen praktischen Spickzettel sollte man auch zur Hand haben: https://pandas.pydata.org/Pandas_Cheat_Sheet.pdf

Du suchst nicht einfaches zusammenfügen, sondern eher die `merge()`-Methode. Und da wahrscheinlich nicht den Voreingestellten "inner"-Join, es sei denn es ist okay das Datensätze raus fallen die keinen Partner in der anderen Tabelle haben.

Dann noch der Praxis-Tipp solche Annahmen wie keine doppelten Fallnummern in Spalte X trotzdem zu prüfen. In beiden Tabellen.
“The best book on programming for the layman is »Alice in Wonderland«; but that's because it's the best book on anything for the layman.” — Alan J. Perlis
Antworten