würde gerne eine japanisches csv File in Python einlesen. Habe es zuerst so versucht:
Code: Alles auswählen
import csv
import re
lesdatei = open("Japanese.csv", "r")
liste = lesdatei.readlines()
for row in liste[1:]:
felder = re.split(",|;", row)
print(str(felder[10]))
Code: Alles auswählen
????
Hokkaido
???????????
???????????
???????????
???????????
???????????
???????????
???????????
???????????
???????????
No Data
No Data
No Data
No Data
Da es nicht alle Ergebnisse richtig anzeigt, habe ich es versucht in UTF-8 umzuwandeln:
Code: Alles auswählen
# -*- coding: utf-8 -*-
import csv
import re
lesdatei = open("Japanese.csv", "r", encoding="utf-8")
liste = lesdatei.readlines()
for row in liste[1:]:
felder = re.split(",|;", row)
print(str(felder[10]))
Code: Alles auswählen
Traceback (most recent call last):
File "C:/Users/khein/PycharmProjects/untitled1/Japanese", line 10, in <module>
liste = lesdatei.readlines()
File "C:\Python34\lib\codecs.py", line 313, in decode
(result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x80 in position 6165: invalid start byte