Python3: UnicodeDecodeError: 'utf8' codec can't decode byte
Verfasst: Sonntag 19. April 2009, 12:51
Ich hab die Doku zu Python3 gelesen und auch die Änderungen im Bezug auf die vorherigen. Ich hab auch den anderen Thread hier bezüglich dieser Problematik gelesen http://www.python-forum.de/topic-18421. ... ecodeerror
Helfen tut mir das alles nicht.
Ich hab eine Datei unbekannter Kodierung und versuche diese einzulesen:
Liefern tut mir der Spass
Was kann man da noch tun, ich habe ne Menge Kodierungen durchprobiert, ascii, die cp varianten und alle utf Möglichkeiten.
Mich wundert extrem, warum selbst im unicode etwas nicht richtig erkannt wird. Soweit ich das weiß, ist es nicht utf-16 oder 32
Edit: Liefert den selben Fehler:
Helfen tut mir das alles nicht.
Ich hab eine Datei unbekannter Kodierung und versuche diese einzulesen:
Code: Alles auswählen
f = open('C:\\4.DAT','r',None,'utf_8');
f.readline()
Ich weiß beim besten Willen nicht, was ich noch tun kann. codes ist ja laut Changelog bei open (codecs.open) nicht mehr notwendig.Traceback (most recent call last):
File "test.py", line 10, in <module>
f.readline()
File "C:\Programme\Python30\lib\io.py", line 1813, in readline
while self._read_chunk():
File "C:\Programme\Python30\lib\io.py", line 1562, in _read_chunk
self._set_decoded_chars(self._decoder.decode(input_chunk, eof))
File "C:\Programme\Python30\lib\io.py", line 1295, in decode
output = self.decoder.decode(input, final=final)
File "C:\Programme\Python30\lib\codecs.py", line 300, in decode
(result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf8' codec can't decode byte 0x81 in position 107: unexpected code byte
Was kann man da noch tun, ich habe ne Menge Kodierungen durchprobiert, ascii, die cp varianten und alle utf Möglichkeiten.
Mich wundert extrem, warum selbst im unicode etwas nicht richtig erkannt wird. Soweit ich das weiß, ist es nicht utf-16 oder 32
Edit: Liefert den selben Fehler:
Code: Alles auswählen
f = open('C:\\4.DAT','rb');
f.readline().decode('utf8');