Vielleicht ist das Problem ja auch das Programm mit dem Maikell die Datei danach anschaut? Vielleicht mag das ein einfaches '\n' nicht, sondern möchte Windows-Zeilentrenner haben.
Genau das ist das Problem!
Habe den Code von Jörg probiert, aber das Problem besteht weiterhin.:(
Dann funktioniert es teilweise! Er schreibt die Liste in die Datei. Nur leider schreibt er dann den String "\n" nicht mehr dazu! Was die Ausgabedatei ziemlich unünbersichtlich macht!
Danke für die Antwort.
Was genau meinst du? In der obersten Zeile steht "# -*- coding: utf-8 -*-"
Meinst du das?
Wenn ich da utf-16 reinschreibe, geht leider gar nichts.
stopwords ist eine utf16 codierte Liste mit deutschen Stopworten wordlist ist ein Dictionary das als key ein Wort enthält und als value die jeweilige Anzahl der Worte wie oft sie in einem Text vorkommen.
In der "stopwords"-Liste stehen Worte, die auch im Dictionary stehen!
Ich komme mit diesen Unicode Objekten einfach nicht richtig klar :(
Ich habe einen Text gegeben. ("text") es ist eine deutsche Geschichte, also mit deutschen Wörtern. Die Satzzeichen sind schon entfernt, und es sind nur Kleinbuchstaben!
Ich habe eine (UTF-16 codierte) Liste (im Beispiel "textdatei" genannt). Jedes Element dieser Liste enhält einen Textabschnitt. Ich möchte nun aus dieser Liste alle Satzzeichen entfernen. Normalerweise würde ich das so machen: