Python encoding
Verfasst: Mittwoch 6. Oktober 2021, 20:14
Moin zusammen,
folgendes Problem:
ich befinde mich auf einem Ubuntu System und möchte csv Dateien lesen, die mir ein Windowssystem zur Verfügung stellt.
Die CSVs sind im ANSI Format und könnten Umlaute enthalten.
Mein Pythonscript läuft natürlich als UTF8
Die CSVs öffne ich mit folgenden Befehl:
Sobald ich einen Umlaut in der Datei habe, fällt das Script mit folgender Meldung hin:
Nach etwas googlen habe ich die Hinweise gefunden, dass ich beim öffnen die codierung mit geben kann:
Leider hilft das auch nur bedingt weiter:
Hat jemand einen Hinweis für mich wie ich dieses Bescheiden Problem zuverlässig umgehen kann?
folgendes Problem:
ich befinde mich auf einem Ubuntu System und möchte csv Dateien lesen, die mir ein Windowssystem zur Verfügung stellt.
Die CSVs sind im ANSI Format und könnten Umlaute enthalten.
Mein Pythonscript läuft natürlich als UTF8
Code: Alles auswählen
#!/usr/bin/env python
# -*- coding: utf-8 -*-
Code: Alles auswählen
with open("import/import.csv", 'r')
Code: Alles auswählen
File "/usr/lib/python3.6/encodings/ascii.py", line 26, in decode
return codecs.ascii_decode(input, self.errors)[0]
UnicodeDecodeError: 'ascii' codec can't decode byte 0xd6 in position 75: ordinal not in range(128)
Code: Alles auswählen
with open("import/import.csv", 'r', encoding='utf-8')
Code: Alles auswählen
File "/usr/lib/python3.6/codecs.py", line 321, in decode
(result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd6 in position 75: invalid continuation byte