Habe nun ein Problem mit Unicode...
Ich möchte gerne eine Datei einlesen und mithilfe von blackbirds Tekisuto Parsen.
So alles ansich kein Problem...
Ich habe aber ein Problem mit den Dateien, die ich einlesen möchte.
In welchem Encoding die gespeichert sind, weiß ich nicht. (wird leider auch in der praxis später so sein).
Nun möchte ich die in Unicode umwandeln (benötigt Tekisuto, zum arbeiten... ).
Ich habe das so versucht:
Code: Alles auswählen
u''.join(r_data)
Code: Alles auswählen
Traceback (most recent call last):
File "dauCMS.py", line 156, in ?
main()
File "dauCMS.py", line 137, in main
dau_parser.parse_files()
File "parser.py", line 190, in parse_files
for token in self.lexer(u''.join(r_data)):
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4 in position 0: ordinal not in range(128)
Code: Alles auswählen
# Inhalt einlesen
r_data = open(self.project_path+data_file, 'r').read()
try:
# Inhalt parsen
data = ''
for token in self.lexer(u''.join(r_data)):
data += token.data
MfG EnTeQuAk