UrlFetch und UnicodeDecodeError
Verfasst: Samstag 25. August 2012, 07:29
Hallo,
seit gestern versuche ich eine xml-Datei aus dem Web abzurufen, das Skript soll am Ende bei GoogleAppEngine laufen.
Die Datei enthält mehrere "ö" und "ü" und fängt folgendermaßen an:
Mein Code zum Herunterladen sieht so aus:
"text" enthält dann aber die "ö" als "ö" und die "ü" als "ü".
Wenn ich versuche die Zeichen durch ".replace("ö","ö")" zu ersetzen erhalte ich "<type 'exceptions.SyntaxError'>" zurück.
Falls ich das nicht tue sondern den Inhalt von "text" direkt weiterverwende(mit ElementTree) erhalte ich folgenden Fehler:
Ich habe es schon mit verschiedenem Encoding versucht, aber der Fehler ist immer der gleiche.
Wie kann ich die Zeichen im Text umwandeln, damit der Inhalt nachher verarbeitet werden kann?
seit gestern versuche ich eine xml-Datei aus dem Web abzurufen, das Skript soll am Ende bei GoogleAppEngine laufen.
Die Datei enthält mehrere "ö" und "ü" und fängt folgendermaßen an:
Code: Alles auswählen
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
Code: Alles auswählen
result = urlfetch.fetch("url")
if result.status_code == 200:
print "Content-type: text/plain\n\n"
text = result.content
print text
Wenn ich versuche die Zeichen durch ".replace("ö","ö")" zu ersetzen erhalte ich "<type 'exceptions.SyntaxError'>" zurück.
Falls ich das nicht tue sondern den Inhalt von "text" direkt weiterverwende(mit ElementTree) erhalte ich folgenden Fehler:
Code: Alles auswählen
<type 'exceptions.UnicodeEncodeError'>: 'ascii' codec can't encode character u'\xf6' in position 1: ordinal not in range(128)
args = ('ascii', u'L\xf6we, 1, 2, 'ordinal not in range(128)')
Wie kann ich die Zeichen im Text umwandeln, damit der Inhalt nachher verarbeitet werden kann?