im Zuge einer Aufgabe, bin ich dabei ein Skript zu schreiben mit dem ich eine Lemmatisierung von den Wörtern in einem Satz durchführe.
Die Sätze kommen aus Tupeln, welche sich in einer Liste befinden - zum Beispiel:
satz = [('Das ist ein super verspielter Satz', '01.01.2020'), ('Das ist ein zweiter super duschgeknallter Satz', '02.01.2020'),('Das ist ein dritter normal verrückter Satz', '03.01.2021')]
(Bitte nicht auf den Sinn der Texte achten )
Nun will ich mit meinem Code für jedes Tupel, die Adjektive und die Verben mit Ihrem Datum in einem separaten Tupel haben.
Code: Alles auswählen
liste_token_deu = []
for token in satz:
for i in nlp(token[0]):
if i.is_alpha:
if not i.is_stop:
if i.pos_ == 'VERB' or i.pos_ == 'ADJ':
text = (i.lemma_, token[1])
liste_token_deu.append(text)
print(liste_token_deu)
Wie zB:
[('super', '01.01.2020'), ('verspielt', '01.01.2020'), ('super', '02.01.2020'), ('duschgeknallter', '02.01.2020'), ('normal', '03.01.2021'), ('verrückt', '03.01.2021')]
Mein Ziel ist aber:
[('super', 'verspielt', '01.01.2020'), ('super', 'duschgeknallter', '02.01.2020'), ('normal', 'verrückt', '03.01.2021')]
Ich bin für jede Idee dankbar!
Vielen Dank für Eure Hilfe,
Russ