Spacy Word to Vec

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
jokulema
User
Beiträge: 4
Registriert: Montag 13. Januar 2020, 15:14

Guten Tag liebe Mitglieder,

ich bin Momentan dabei ein Klassifizierungsmodell technisch ähnlicher Wörter zu entwickeln. Dabei bin ich auf die Lösung des Word to Vec gestoßen.

Ziel ist es zu erkennen, dass zb. Batterie und Akku und Akkumulator ähnlich sind.

Eigentlich funktioniert genau diese Problemstellung mit Spacy ganz gut. Mit Beispielwörtern wie Apfel Banane und Auto sind sehr gut die ähnlichen Wörter zu identifiziere (auch wenn der Rechenprozess lange dauert).

Bei technischeren Wörtern hingegen werden Nullvektoren ausgegeben. Das heißt, dass diese Wörter nicht zugeordnet werden können, die Bibliothek also keine Informationen über die Wörter hat.

Kennt Ihr andere Bibliotheken, die vielleicht mehr Wörter beinhalten oder habt Ihr andere Ideen?

Vielen Dank für Eure Hilfe
Johannes
Antworten