ich habe folgendes Problem.
Von meinem MediaServer bekomme ich die Titel (im Format wie bei mystring) der Videos als XML geliefert.
Einer der Titel (Die Erlösung) enthält das ö und das macht Probleme.
Im Beispiel liefern alle Codecs, die zur Verfügung stehen,
entweder einen Fehler ala 'ascii' codec can't decode byte 0xc3 in position 7: ordinal not in range(128) oder charmap ...
oder Die Erl├Âsung als Ausgabe.
Code: Alles auswählen
# -*- encoding: utf-8 -*-
mystring='\x44\x69\x65\x20\x45\x72\x6C\xC3\xB6\x73\x75\x6E\x67'
print mystring
for enc in ['ascii','big5','big5hkscs','cp037','cp424',
'cp437','cp500','cp720','cp737','cp775','cp850',
'cp852','cp855','cp856','cp857','cp858','cp860',
'cp861','cp862','cp863','cp864','cp865','cp866',
'cp869','cp874','cp875','cp932','cp949','cp950',
'cp1006','cp1026','cp1140','cp1250','cp1251',
'cp1252','cp1253','cp1254','cp1255','cp1256',
'cp1257','cp1258','euc_jp','euc_jis_2004',
'euc_jisx0213','euc_kr','gb2312','gbk','gb18030',
'hz','iso2022_jp','iso2022_jp_1','iso2022_jp_2',
'iso2022_jp_2004','iso2022_jp_3','iso2022_jp_ext',
'iso2022_kr','latin_1','iso8859_2','iso8859_3',
'iso8859_4','iso8859_5','iso8859_6','iso8859_7',
'iso8859_8','iso8859_9','iso8859_10','iso8859_13',
'iso8859_14','iso8859_15','iso8859_16','johab',
'koi8_r','koi8_u','mac_cyrillic','mac_greek',
'mac_iceland','mac_latin2','mac_roman','mac_turkish',
'ptcp154','shift_jis','shift_jis_2004','shift_jisx0213',
'utf_32','utf_32_be','utf_32_le','utf_16','utf_16_be',
'utf_16_le','utf_7','utf_8','utf_8_sig','utf-8']:
try:
#print '{0} = {1}'.format(enc, mystring.encode(enc)) # alle melden Fehler
#print '{0} = {1}'.format(enc, unicode(mystring,enc)) # alle melden Fehler
#print '{0} = {1}'.format(enc, unicode(mystring).encode(enc)) # alle melden Fehler
print '{0} = {1}'.format(enc, unicode(mystring,enc).encode(enc)) # ein paar funktionieren z.B. latin_1 aber immer nur Die Erl├Âsung
except Exception, e:
print '{0} = ERROR :: {1}'.format(enc,e)
Vielen lieben Dank
Claudia