Jeweils Nomen und Verb eines jeden Satzes ausgeben lassen

Noranora · Montag 21. März 2016, 08:06

Hallo!
Gibt es eine Möglichkeit sich jeweils das Nomen und das Verb eines jeden Satzes eines Textes ausgeben zu lassen? Mit regExpr. ist das ein bisschen schwierig. Daher habeich es nun mit NLTK versucht. Also ich parse den ganzen Text und suche dann nach den Nomen und Verben.

Code: Alles auswählen


for i in text:

    nom= re.findall(r'([A-Z][a-z]*/NN)+',str(satzprobe)) 
    verb=re.findall(r'([a-z]*/VBN|[a-z]*/VB/I|[a-z]*/RP/O|[a-z]*/VB/B)', str(satzprobe)) 

variable= int(0)
while variable<len(text):

 #   #if verb in i:
    nom_verb=(nom[zaehler],verb[zaehler])

    
    print(nom_verb)
    variable=variable+1
   # if variable==(len(text)):
    #             break

Das Problem ist jedoch, dass innrehalb eines Satzes auch zwei Wörter mit verbaler Kennzeichnung auftreten können oder ggf. auch mal keines.
Es werden also immer ein Nomen und ein Verb ausgegeben, aber diese stehen in den ursprünglichen Text nicht alle in einem Satz, und ddurch, dass immer zwei Wörter aufgelistet werden, verschiebt sich natürlich alles und die Wörter die dort aufgelistet sind stehen im Text in gra keinem Zusammenhang mehr...

Wisst ihr wie ich dieses Problem lösen könnte?? Ihr würdet mir sehr weiterhelfen!

Danke schon mal für jegliche Tipps!