Re: Python Excel Vergleich Werte
Verfasst: Samstag 17. Juli 2021, 18:01
Also schlägst du vor mit einer anderen Bibliothek die Daten einzulesen ?
Wie bspw. openpyxl
Wie bspw. openpyxl
Seit 2002 Diskussionen rund um die Programmiersprache Python
https://www.python-forum.de/
Du hast dich jetzt schon für einen anderen Ansatz entschieden, wenn ich das korrekt verstanden habe, aber mal der Vollständigkeit halber:servus_97 hat geschrieben: Dienstag 13. Juli 2021, 10:50 Würde ich jedoch den ersten Ansatz nehmen, so könnte man auch "nltk.edit_distance()" verwenden.
Code: Alles auswählen
x = df_correct['name'].to_string().splitlines()
die Wahrscheinlichkeit 1.Nike | 1 | Ni
...unter den gegebenen Auswahlmöglichkeiten, genau. Wenn Du meinen Code benutzt hast, sind das natürlich 100%, denn die Anzahl der korrekten Möglichkeiten ist mit 2 ja sehr überschaubar, und die beiden Namen "Nike" und "Bosch AG" unterscheiden sich ja dann doch sehr deutlich.servus_97 hat geschrieben: Sonntag 18. Juli 2021, 16:25 Jetzt bekommen ich überalldie Wahrscheinlichkeit 1.Nike | 1 | Ni
D.h. der Algorithmus erkennt Ni mit 100% WK als Nike an ?
Ich würde dem DataFrame zu Kontrollzwecken zwei neue Spalten hinzufügen, so im Kern (ungetestet):servus_97 hat geschrieben: Sonntag 18. Juli 2021, 16:25 Und wie könnte ich jetzt einfach, in dem Fall, Ni als Nike ändern ?
Code: Alles auswählen
def predict_name(val):
# Korrekten Namen 'name' und Wahrscheinlichkeit 'prob' berechnen
return pd.Series({'name': name, 'prob': prob})
df[['name', 'prob']] = df.Marken.apply(predict_name, axis=1)