Tagger und NLTK
Verfasst: Donnerstag 28. Juni 2012, 15:38
Hallo,
in Bezug auf dieses Projekt Tagger - GitHub (lieber erstmal README.rst durchlesen, damit ihr versteht um was ich gleich rede), möchte ich gerne ein deutsches Äquivalent zu der Datei data/dict.pkl erstellen. Allerdings habe ich leider nicht ganz verstanden wie ich das machen soll; Der Entwickler Apresta nennt als Möglichkeit ein eigenes Wörterbuch zu erstellen, seine Funktion aus "extras.py":
Hierbei weis ich jetzt aber nicht wie ich dort ansetzen soll, damit mir die Funktion ein deutsches Wörterbuch erstellt.
in Bezug auf dieses Projekt Tagger - GitHub (lieber erstmal README.rst durchlesen, damit ihr versteht um was ich gleich rede), möchte ich gerne ein deutsches Äquivalent zu der Datei data/dict.pkl erstellen. Allerdings habe ich leider nicht ganz verstanden wie ich das machen soll; Der Entwickler Apresta nennt als Möglichkeit ein eigenes Wörterbuch zu erstellen, seine Funktion aus "extras.py":
Code: Alles auswählen
build_dict_from_nltk(output_file, nltk.corpus.brown,
nltk.corpus.stopwords.words('english'), measure='ICF')