ich bin Pythonneuling und ich weiß auch dass es zu dem Thema hier und woanders Tutorials gibt, die ich auch gelesen habe aber anscheinend bin ich zu doof dafür:
Ich bin unter Windows und ich muss mit 2.7.x arbeiten. Ich habe eine *.txt, die deutsche Dorfnamen enthält. Wenn ich sie im Editor aufmache und dann auch "Speichern unter..." gehe, dann zeigt mir das ANSI an. Das muss auch so bleiben, weil ich von meinen Kollegen nicht erwarten kann, dass sie unter einer bestimmten Kodierung abspeichern. Als in der Datei nur namen ohne Umlaute oder "ß" standen hat mein Skript (momentan ca. 300 Zeilen) super funktioniert, nun habe ich den Ortnamen "Münsingen" eingefügt und laufe gleich am Anfang in den einen Fehler:
Code: Alles auswählen
import sys
import os
import io
try:
d = io.open("MEINPFAD/config.txt", "r", encoding = "ISO-8859-1")
except:
print("Dateizugriff auf config.txt nicht erfolgreich!")
sys.exit(0)
print("\n>>>>>> Lese Konfigurationsdatei...")
alllines = d.readlines()
d.close()
tokens = []
for i in alllines:
tokens.append(i.strip('\n'))
print(tokens)
print(">>>>>> Suche nach gueltigen Projektpfaden...")
pp = []
p = [x[0] for x in os.walk("T:/Planung/Plaene")]
for i in tokens:
pp.append([s for s in p if i in s])
print(pp)
Was ich v.a. nicht verstehe: beim print von tokens ist das ü ja richtig drin. Es ist doch der richtige Ansatz am am Anfang alles in u-Strings zu bringen?
danke euch