Ich habe hier ein kleines Unicode-Problem:
eine utf8-Datei in der sich japanischer Text befindet
Code: Alles auswählen
dictionary = codecs.open( "liste", "r", "utf-8" )
for line in dictionary:
line_array=line.split(" ",1)
print line_array[0], line_array[1]
liste.append([line_array[0], line_array[1]])
"print liste" jedoch "[[u'\u65e5', u'\u3072\n']]"
"for j in liste: print j[0]" gibt dann wieder "日"
Könnt Ihr mir erklären warum die zeite Ausgabe so merkwürdig ist?
Mit verwirrten Grüßen
Roland