Seite 1 von 1

Vergleich von Spalten Excel

Verfasst: Mittwoch 14. Juli 2021, 16:09
von servus_97
Hallo Leute.

Problem:

Ich habe zwei Excel Sheets gleichen Spaltennamen, jedoch sind die Werte durcheinander. (z.B. im ersten Sheet steht x in der 3 Zeile und im zweiten dann in der 6 Zeile)
Jedoch gibt es einen Unique Wert in der Spalte "XYZ" .
Nun möchte ich jeweils eine Spalte von dem einen Sheet und eine andere Spalte von dem anderen vergleichen, wenn der Unique Wert übereinstimmt.
In den zu vergleichenden Spalten sind float Werte.

Bspw.
Schritt 1) Vergleiche von beiden Sheets den Unique Wert in der Spalte "XYZ"
Schritt 2) Bei Übereinstimmung, Vergleiche von beiden Sheets die Spalte "XY"
Schritt 3) Gib am Ende aus, in welcher Spalte es höhere Werte gibt.
Schritt 3.1) Ausgabe mit statistischen Plots wäre richtig gut.



Ich hoffe, dass ich das ein wenig erklären konnte.


Ansatz:
je Excel Sheet die Spalten "XY" und "XYZ" in Dictionary packen. Daraus ergeben sich zwei dict.
Die dann miteinander vergleichen, jedoch wäre es sinnlos wenn das eine Sheet nur 100 Zeilen hat und das andere 1000 Zeilen.

Hat jemand einen Ansatz für mich :mrgreen:


Liebe Grüße

Re: Vergleich von Spalten Excel

Verfasst: Mittwoch 14. Juli 2021, 17:57
von __deets__
Du brauchst pro Sheet ein dict, mit dem Wert der Spalte XYZ als Schlüssel, und alles Werten als Wert. Und dann kannst du über die Teilmenge der gleichen keys in beiden dicts basierend auf XY (sehr schlecht gewählter Name für diese Diskussion. Weil kaum zu unterscheiden von XYZ. Gibt es einen Grund, dass du die echten Namen verschweigst?) anstellen.

Re: Vergleich von Spalten Excel

Verfasst: Mittwoch 14. Juli 2021, 18:45
von servus_97
Der Name für die Diskussion ist echt ziemlich schlecht gewählt :/
Also was ich jetzt gemacht habe, ich habe die als DataFrames eingelesen und versuche die Spaltenwerte über np.where zu vergleichen. Jedoch fehlt da der Teil mit dem Unique Wert aus der Spalte XYZ

Ne ne ist eigentlich nur eine Aufgabe. Es geht um zwei Datensätze von Verkaufszahlen aus zwei Ländern.
Und ich versuche anhand des unique Werts "Nike" die Spalte "Oktober" von beiden Daten zu vergleichen. Um am Ende auszugeben, welches Land mehr verkaufe erzielen konnte. Ganz grob erklärt