Tupeln richtig ausgeben
Verfasst: Sonntag 20. Juni 2021, 12:31
Hallo Zusammen,
im Zuge einer Aufgabe, bin ich dabei ein Skript zu schreiben mit dem ich eine Lemmatisierung von den Wörtern in einem Satz durchführe.
Die Sätze kommen aus Tupeln, welche sich in einer Liste befinden - zum Beispiel:
satz = [('Das ist ein super verspielter Satz', '01.01.2020'), ('Das ist ein zweiter super duschgeknallter Satz', '02.01.2020'),('Das ist ein dritter normal verrückter Satz', '03.01.2021')]
(Bitte nicht auf den Sinn der Texte achten
)
Nun will ich mit meinem Code für jedes Tupel, die Adjektive und die Verben mit Ihrem Datum in einem separaten Tupel haben.
Das Problem dabei ist, dass wenn ich mit der zweiten For-Schleife auf das Tupel zugreife, zerschlage ich die Tupeln und bekomme eine Liste mit Tupeln zurück, bei denen nach jedem ADJ und VERB das Datum mit ausgegeben wird.
Wie zB:
[('super', '01.01.2020'), ('verspielt', '01.01.2020'), ('super', '02.01.2020'), ('duschgeknallter', '02.01.2020'), ('normal', '03.01.2021'), ('verrückt', '03.01.2021')]
Mein Ziel ist aber:
[('super', 'verspielt', '01.01.2020'), ('super', 'duschgeknallter', '02.01.2020'), ('normal', 'verrückt', '03.01.2021')]
Ich bin für jede Idee dankbar!
Vielen Dank für Eure Hilfe,
Russ
im Zuge einer Aufgabe, bin ich dabei ein Skript zu schreiben mit dem ich eine Lemmatisierung von den Wörtern in einem Satz durchführe.
Die Sätze kommen aus Tupeln, welche sich in einer Liste befinden - zum Beispiel:
satz = [('Das ist ein super verspielter Satz', '01.01.2020'), ('Das ist ein zweiter super duschgeknallter Satz', '02.01.2020'),('Das ist ein dritter normal verrückter Satz', '03.01.2021')]
(Bitte nicht auf den Sinn der Texte achten

Nun will ich mit meinem Code für jedes Tupel, die Adjektive und die Verben mit Ihrem Datum in einem separaten Tupel haben.
Code: Alles auswählen
liste_token_deu = []
for token in satz:
for i in nlp(token[0]):
if i.is_alpha:
if not i.is_stop:
if i.pos_ == 'VERB' or i.pos_ == 'ADJ':
text = (i.lemma_, token[1])
liste_token_deu.append(text)
print(liste_token_deu)
Wie zB:
[('super', '01.01.2020'), ('verspielt', '01.01.2020'), ('super', '02.01.2020'), ('duschgeknallter', '02.01.2020'), ('normal', '03.01.2021'), ('verrückt', '03.01.2021')]
Mein Ziel ist aber:
[('super', 'verspielt', '01.01.2020'), ('super', 'duschgeknallter', '02.01.2020'), ('normal', 'verrückt', '03.01.2021')]
Ich bin für jede Idee dankbar!
Vielen Dank für Eure Hilfe,
Russ