Ähnliche Inhalte Spalte identifizieren und speichern
Verfasst: Samstag 27. Juni 2020, 12:22
Hallo,
ich muss für eine Analyse meine Daten strukturieren.
Dafür muss ich die Spalten in meinem Data.frame auf Ähnlichkeit untersuchen.
Ich habe beispielsweise "Laufen lang", "lang laufen", "lang Laufen". Das sind immer andere Schreibweisen, aber beschreiben eigentlich immer das gleiche.
"Lang laufen" ist nur ein Beispiel für viele Wortgruppen, die mir unbekannt sind.
Es sollen somit die Ähnlichkeiten aufgedeckt werden und anschließend "Lang laufen" an alle Positionen geschrieben werden.
Ich bin neu bei Python und weiß nicht wie ich das umsetzen muss bzw. welche Pakete ich dafür benötige.
Vllt hatte jemand von euch das gleiche Problem gehabt und kann mir vllt weiterhelfen.
Vielen Dank,
metall
ich muss für eine Analyse meine Daten strukturieren.
Dafür muss ich die Spalten in meinem Data.frame auf Ähnlichkeit untersuchen.
Ich habe beispielsweise "Laufen lang", "lang laufen", "lang Laufen". Das sind immer andere Schreibweisen, aber beschreiben eigentlich immer das gleiche.
"Lang laufen" ist nur ein Beispiel für viele Wortgruppen, die mir unbekannt sind.
Es sollen somit die Ähnlichkeiten aufgedeckt werden und anschließend "Lang laufen" an alle Positionen geschrieben werden.
Ich bin neu bei Python und weiß nicht wie ich das umsetzen muss bzw. welche Pakete ich dafür benötige.
Vllt hatte jemand von euch das gleiche Problem gehabt und kann mir vllt weiterhelfen.
Vielen Dank,
metall