MaxEnt-Classifier (NLTK)
Verfasst: Sonntag 16. August 2009, 09:16
Allgemeines Hallo,
beim Training meines MaxEnt-Classifiers entstehen Ergebnisse, aus denen ich nicht recht schlau werde:
Kurze Google-Recherche ergibt: "nan" steht für "not a number" und weist meist auf eine Division durch Null hin. Bei der Berechnung der Log-Likelihood meiner Trainingsdaten wurde also vermutlich durch Null geteilt.
Um weiterzukommen, müsste man wissen, wie diese Berechnung genau abläuft. Kann mir an dieser Stelle jemand weiterhelfen oder hat, unabhängig davon, irgendeinen Erklärungsansatz?
Schon einmal vielen Dank,
Nadine
beim Training meines MaxEnt-Classifiers entstehen Ergebnisse, aus denen ich nicht recht schlau werde:
Code: Alles auswählen
>>> classifier = nltk.MaxentClassifier.train(train_set, max_iter = 10 )
==> Training (10 iterations)
Iteration Log Likelihood Accuracy
---------------------------------------
1 -2.19722 0.212
2 -0.48707 0.792
3 nan 0.857
4 nan 0.029
5 nan 0.024
6 nan 0.024
7 nan 0.024
8 nan 0.024
9 nan 0.024
Final nan 0.024
Um weiterzukommen, müsste man wissen, wie diese Berechnung genau abläuft. Kann mir an dieser Stelle jemand weiterhelfen oder hat, unabhängig davon, irgendeinen Erklärungsansatz?
Schon einmal vielen Dank,
Nadine