Gibt es eine Möglichkeit sich jeweils das Nomen und das Verb eines jeden Satzes eines Textes ausgeben zu lassen? Mit regExpr. ist das ein bisschen schwierig. Daher habeich es nun mit NLTK versucht. Also ich parse den ganzen Text und suche dann nach den Nomen und Verben.
Code: Alles auswählen
for i in text:
nom= re.findall(r'([A-Z][a-z]*/NN)+',str(satzprobe))
verb=re.findall(r'([a-z]*/VBN|[a-z]*/VB/I|[a-z]*/RP/O|[a-z]*/VB/B)', str(satzprobe))
variable= int(0)
while variable<len(text):
# #if verb in i:
nom_verb=(nom[zaehler],verb[zaehler])
print(nom_verb)
variable=variable+1
# if variable==(len(text)):
# break
Es werden also immer ein Nomen und ein Verb ausgegeben, aber diese stehen in den ursprünglichen Text nicht alle in einem Satz, und ddurch, dass immer zwei Wörter aufgelistet werden, verschiebt sich natürlich alles und die Wörter die dort aufgelistet sind stehen im Text in gra keinem Zusammenhang mehr...
Wisst ihr wie ich dieses Problem lösen könnte?? Ihr würdet mir sehr weiterhelfen!
Danke schon mal für jegliche Tipps!