Seite 1 von 1

String als unicode kennzeichnen

Verfasst: Sonntag 27. Dezember 2009, 23:39
von jbs
Hallo,

ich habe das Problem, dass ich einen String habe, der eigentlich unicode enthält. Also `'\xfc'`. Dies soll nun als Unicode verstanden werden.

Ich habs bisher über eval gemacht, was mir aber etwas dreckig erscheint.

Verfasst: Montag 28. Dezember 2009, 00:00
von DasIch
Spontan fällt mir folgendes ein:

Code: Alles auswählen

u"".join(unichr(ord(char)) for char in "\xfc")

Verfasst: Montag 28. Dezember 2009, 00:02
von Defnull
"Unicode" hat eigentlich keine feste Byte-Repräsentation. Die interne Repräsentation von Unicode-Strings ist Plattform-abhängig und sollte niemals als nicht-unicode-objekt auf tauchen. Was du da hast, ist ein irgendwie codierter String, den du dekodieren musst.

Tipp: \xfc ist latin1 (oder latin9) für 'ü'.

Verfasst: Montag 28. Dezember 2009, 00:14
von jbs
Defnull hat geschrieben:"Unicode" hat eigentlich keine feste Byte-Repräsentation. Die interne Repräsentation von Unicode-Strings ist Plattform-abhängig und sollte niemals als nicht-unicode-objekt auf tauchen. Was du da hast, ist ein irgendwie codierter String, den du dekodieren musst.

Tipp: \xfc ist latin1 (oder latin9) für 'ü'.
Ah. Nun gehts :). Danke.

Ich hatte bei \xfc immer an utf-8 gedacht.