Opinion Mining mit Python - Hilfestellung gesucht
Verfasst: Dienstag 17. Mai 2016, 16:03
Hallo zusammen,
ich studiere Sprachwissenschaften und belege zurzeit ein Seminar, indem es darum geht mithilfe von Python automatisierte Hilfestellungen für die Sprachwissenschaften zu liefern. Da ich recht wenig Kenntnisse in puncto Programmierung habe und auch bisher nur ein paar Basics von Python gelernt habe, dachte ich mein Anliegen hier im Forum zu äußern.
Zum Problem: Ich habe eine .txt-Datei erstellt mit 100 Testsätzen aus zufälligen Kundenrezensionen. Python soll mir nun dabei helfen, ob ein Satz eher positiv oder negative Meinung enthält. In der .txt-Datei befindet sich z.B. der Satz:"Der Preis ist unschlagbar, kann ich sehr empfehlen." Der Satz ist also positiv zu bewerten. Nachdem ich nun eine vom Professort vorgegebene .py-Datei laufen lasse und die .txt-Datei einbinde kommt in der Shell das Ergebnis:
der:0
Preis:0.0
sein:0
unschlagbar:1.5
Kann:0
ich:0
sehr:0
empfehlen:1.5
SCOUNT: 3.0
Jeder einzelne Bestandteil wird also bewertet und dann aufsummiert. Ich würde jedoch gerne als Ausgabe den kompletten Satz haben ohne die einzelnen Werte, also:
Der Preis ist unschlagbar, kann ich sehr empfehlen: SCOUNT:3.0
Wie würde man das in einer .py-Datei formulieren?
Hier ein Screenshot von der .py-Datei (anfangs werden Module von nltk imporiert, die bei der Bewertung der Wörter helfen)
Vielen lieben Dank im Voraus!
Euer Semantiker
ich studiere Sprachwissenschaften und belege zurzeit ein Seminar, indem es darum geht mithilfe von Python automatisierte Hilfestellungen für die Sprachwissenschaften zu liefern. Da ich recht wenig Kenntnisse in puncto Programmierung habe und auch bisher nur ein paar Basics von Python gelernt habe, dachte ich mein Anliegen hier im Forum zu äußern.
Zum Problem: Ich habe eine .txt-Datei erstellt mit 100 Testsätzen aus zufälligen Kundenrezensionen. Python soll mir nun dabei helfen, ob ein Satz eher positiv oder negative Meinung enthält. In der .txt-Datei befindet sich z.B. der Satz:"Der Preis ist unschlagbar, kann ich sehr empfehlen." Der Satz ist also positiv zu bewerten. Nachdem ich nun eine vom Professort vorgegebene .py-Datei laufen lasse und die .txt-Datei einbinde kommt in der Shell das Ergebnis:
der:0
Preis:0.0
sein:0
unschlagbar:1.5
Kann:0
ich:0
sehr:0
empfehlen:1.5
SCOUNT: 3.0
Jeder einzelne Bestandteil wird also bewertet und dann aufsummiert. Ich würde jedoch gerne als Ausgabe den kompletten Satz haben ohne die einzelnen Werte, also:
Der Preis ist unschlagbar, kann ich sehr empfehlen: SCOUNT:3.0
Wie würde man das in einer .py-Datei formulieren?
Hier ein Screenshot von der .py-Datei (anfangs werden Module von nltk imporiert, die bei der Bewertung der Wörter helfen)
Vielen lieben Dank im Voraus!
Euer Semantiker