Helfen tut mir das alles nicht.
Ich hab eine Datei unbekannter Kodierung und versuche diese einzulesen:
Code: Alles auswählen
f = open('C:\\4.DAT','r',None,'utf_8');
f.readline()
Ich weiß beim besten Willen nicht, was ich noch tun kann. codes ist ja laut Changelog bei open (codecs.open) nicht mehr notwendig.Traceback (most recent call last):
File "test.py", line 10, in <module>
f.readline()
File "C:\Programme\Python30\lib\io.py", line 1813, in readline
while self._read_chunk():
File "C:\Programme\Python30\lib\io.py", line 1562, in _read_chunk
self._set_decoded_chars(self._decoder.decode(input_chunk, eof))
File "C:\Programme\Python30\lib\io.py", line 1295, in decode
output = self.decoder.decode(input, final=final)
File "C:\Programme\Python30\lib\codecs.py", line 300, in decode
(result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf8' codec can't decode byte 0x81 in position 107: unexpected code byte
Was kann man da noch tun, ich habe ne Menge Kodierungen durchprobiert, ascii, die cp varianten und alle utf Möglichkeiten.
Mich wundert extrem, warum selbst im unicode etwas nicht richtig erkannt wird. Soweit ich das weiß, ist es nicht utf-16 oder 32
Edit: Liefert den selben Fehler:
Code: Alles auswählen
f = open('C:\\4.DAT','rb');
f.readline().decode('utf8');