in Bezug auf dieses Projekt Tagger - GitHub (lieber erstmal README.rst durchlesen, damit ihr versteht um was ich gleich rede), möchte ich gerne ein deutsches Äquivalent zu der Datei data/dict.pkl erstellen. Allerdings habe ich leider nicht ganz verstanden wie ich das machen soll; Der Entwickler Apresta nennt als Möglichkeit ein eigenes Wörterbuch zu erstellen, seine Funktion aus "extras.py":
Code: Alles auswählen
build_dict_from_nltk(output_file, nltk.corpus.brown,
nltk.corpus.stopwords.words('english'), measure='ICF')