Ich arbeite zum ersten mal mit nltk. Ich habe einen Text parsen lassen und die einzelnen Sätze gesplittet, so das ich anschließend eine Liste mit Sätzen habe (s. Code).
Code: Alles auswählen
first = parse(text)
s = split(first)
#print(s)
sent=s.sentences
Nun möchte ich gerne gucken, aus welchen Wörtern jeder Satz besteht. Dafür müsste ich aber jeweils die Endungen "/RB/I-NP/...." (s. unten) alle weider loswerden. Mit split("/") geht das leider nicht. Gibt es da eine andere Lösung oder wie könnte ich vorgehen? Das Ziel ist nämlich, jeden Satz mit einem Sentiment-Lexikon zu vergleichen., also ich würde gerne gucken, ob Sätze eher positiv oder negativ sind. Habt ihr da sonst andere Ideen?
ohnehin/RB/I-NP/O nur/RB/I-NP/O bedingt/JJ/I-NP/O einsatzbereite/NN/I-NP/O
Wie gesegt, ich bin noch Anfänger und bin für alle Hinweise dankbar! Ich weiß auch es gibt eine Dokumenation zu NLTK, allerdings weiß ich da gerade nicht so recht, wo ich suchen muss ://
