Python (pandas) merge führt zu unterschiedlichem Ergebnis wie Excel

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
NinoBaumann
User
Beiträge: 80
Registriert: Samstag 25. April 2020, 19:03

Hallo,

ich habe zwei Datenquellen (CSV-Dateien). Beides sind Daten von Bauteilen. Der eine Datensatz enthält maßliche Informationen die gemessen wurden und der andere physikalische Messwerte (Drehmomente etc.). In beiden Datensätzen gibt es eine Spalte in der der DMC Code des Bauteils steht. Beide Datensätze lese ich mit Python in zwei separierte DataFrames ein. Hier mache ich noch ein paar Umstrukturierungen etc.. Danach speichere ich die beiden überarbeiteten Datensätze wieder als CSV-Datei ab. Anschließend mache ich einen merge über den DMC. Hier ist mir aufgefallen, dass mir die aktuellen Daten von heute fehlen. Der letzte Datensatz ist hier von gestern. Wenn ich jedoch die CSV Dateien mit Excel einlesen und ebenfalls einen merge damit durchführe, bekomme ich die aktuellen Datensatz von heute. Ich weiß jetzt nur nicht worüber Python hier stolpert. Hatte jemand von euch mal ein ähnliches Problem oder weiß, worauf hier zu achten ist?
Meine Code Zeilen zum Merge sind:

Code: Alles auswählen

dfData_klein = dfData_NTMR014.merge(dfData_NTSP073, how = 'inner', left_on = ['DMC_innen_AR'], right_on = ['DMC_innen_EoL'])
dfData_klein = dfData_klein.sort_values(by='Frenco_Zeitstempel', ascending=False)

dfData_klein.to_csv('I:/SharedFolders/Data7370_7670_7517_Merge.csv', header=True, index=False) 
NinoBaumann
User
Beiträge: 80
Registriert: Samstag 25. April 2020, 19:03

Okay. ich habe den Fehler gefunden. In den DMC Spalten waren wohl gemischte Datentypen. Nachdem ich beide DMC Spalten in ein und denselben Typ umgewandelt und erneut einen Merge durchgeführt habe, hat alles funktioniert.
Antworten