Excel kombinieren, Problem mit datenformat

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
Alk Pacino
User
Beiträge: 1
Registriert: Mittwoch 5. April 2023, 07:41

Hallo zusammen,
Ich habe folgendes Problem: ich habe zwei Excel Tabellen, die unterschiedlich aufgebaut sind, aus denen ich einzelne Spalten kombinieren und in einer neu erstellten Tabelle vergleichen will.

In beiden Tabellen sind die einzelnen Datensätze(/zeilen) mit einer fünfstelligen Nummer versehen.

Mein Ansatz: ich gehe eine der Liste mit( df1 = pd.read_excel(datei.xlsx) und analog df2)

for index, rows in df1.iterrows(): durch
Und suche dann über die fünfstellige Nummer in der der anderen Tabelle die zeile und kopiere die relevanten daten. Das mache ich mit

Liste = []

Liste.append(df2[df2['Nummer ']==rows['Nummer 1]]['spaltenname']

Die Liste packe ich dann mit dem entsprechenden Key in einen neuen dataframe und erzeuge dann mit to_Excel eine neue Datei

Jetzt sind in der Liste aber Series Objekte drin, die ich so nicht verwerten kann. Ich möchte z.b. Daten ( in diesem Fall Mehrzahl von Datum) vergleichen. Die Zellen aus Tabelle 1 sind Strings aus denen ich ein timestamp basteln kann. Wenn ich dies mit den Daten aus Tabelle 2 vergleichen möchte meckert python, dass ein Series Object nicht vergleichen kann. Ich hab schon probiert die Objekte umzuwandeln, es funktioniert aber nichts....


Ich hoffe ich konnte mich halbwegs verständlich ausdrücken und jemanden fällt etwas dazu ein...
Danke schon mal
Sirius3
User
Beiträge: 18274
Registriert: Sonntag 21. Oktober 2012, 17:20

Bitte poste den Code, den Du versucht hast, inklusive Beispieldaten, mit denen man Dein Problem nachvollziehen kann.

for-Schleifen sind mit Pandas-Dataframes meistens falsch. Vielleicht suchst Du etwas wie join oder merge.
https://pandas.pydata.org/docs/referenc ... .join.html
https://pandas.pydata.org/docs/referenc ... merge.html
Antworten