ich bin ziemlicher Python-Anfänger, also sorry schon mal, wenn ich hier Fachtermini nicht korrekt ausdrücke

Was ich erreichen will: Eine Liste aus Wörtern die aus einer beliebigen .txt erstellt wird.
Die .txt ist dabei ein beliebiger Text mit Satzzeichen, Klammern etc.
Hier bin ich aktuell:
Code: Alles auswählen
raw_list = list()
test = 'test.txt'
file = open(test, encoding="utf8")
# badchars = '().;,'
with file as words:
for word in words:
if word not in raw_list:
raw_list.append(word.strip())
print (raw_list)
newfile = 'dic.txt'
with open(newfile, 'w') as fout:
for words in raw_list:
fout.write(words + '\n')
- Alle Zeichen beim "importieren" ignorieren, sodass nur die Wörter der .txt ausgewählt werden, und keine Zeichen wie Kommas, Klammern etc. (siehe badchars).
- Alle Wörter die mit einem Kleinbuchstaben beginnen ignorieren
Ich freue mich über jede Hilfe bzw. jeden Tipp. Danke!