Ich schreibe grade ein "Textanalyse-Werkzeug", und der erste Algorithmus überführt eine gewöhnliche Textdatei in eine Liste, die einfach
den Text darstellt - nur als Liste von Strings, die einfach die (gelowerten) Wörter enthält.
Der Code dazu ist der folgende:
Code: Alles auswählen
with open("text.txt", "r") as file:
line_list = [line.split() for line in file]
word_list = []
for line in line_list:
for word in line:
word_list.append( (word.strip(" ,.;:?'\"<>%*+-/=_~!§$&(){}[]#")).lower() )