Weis jetzt nicht direkt ob das hier hineingehört, weil das Problem im Coding bereich liegt aber was solls:
In einer liste, welche ich aus LDAP abgefragt habe, befinden sich umlaute also ä ö ü, welche aber nicht direkt angezeigt werden.
z.B. gibt ein ä \xc3\xa4 herraus. Was auch keinem reinen Unicode entspricht.
Ich habe http://www.python-forum.de/topic-5095.h ... ht=umlaute hiermit versucht mich durchzuhangeln, aber irgendwie kriege ich nur die codierung ins Unicode hin da kommt dann: \xe4 für das ä raus.
Kann mir jemand sagen warum ich beim decode ne exception raus kriege?
Edit: achja was noch erwähnsenswert ist: die dateien befinden sich in einer list, welche dictionaries beinhaltet.
Umlaute
- gerold
- Python-Forum Veteran
- Beiträge: 5555
- Registriert: Samstag 28. Februar 2004, 22:04
- Wohnort: Oberhofen im Inntal (Tirol)
- Kontaktdaten:
Hallo Thomas!Thomas Scolter hat geschrieben:z.B. gibt ein ä \xc3\xa4 herraus. Was auch keinem reinen Unicode entspricht.
Das ist UTF-8. Das kannst du mit ``decode("utf-8")`` nach Unicode umwandeln.
Code: Alles auswählen
>>> s_utf8 = u"ä".encode("utf-8")
>>> s_utf8
'\xc3\xa4'
>>> s_uni = s_utf8.decode("utf-8")
>>> s_uni
u'\xe4'
>>>
Gerold

http://halvar.at | Kleiner Bascom AVR Kurs
Wissen hat eine wunderbare Eigenschaft: Es verdoppelt sich, wenn man es teilt.
Wissen hat eine wunderbare Eigenschaft: Es verdoppelt sich, wenn man es teilt.
-
- User
- Beiträge: 7
- Registriert: Montag 1. Oktober 2007, 11:31
Jop mein fehler. Vielen Dank klappt jetzt