Seite 1 von 1
String als unicode kennzeichnen
Verfasst: Sonntag 27. Dezember 2009, 23:39
von jbs
Hallo,
ich habe das Problem, dass ich einen String habe, der eigentlich unicode enthält. Also `'\xfc'`. Dies soll nun als Unicode verstanden werden.
Ich habs bisher über eval gemacht, was mir aber etwas dreckig erscheint.
Verfasst: Montag 28. Dezember 2009, 00:00
von DasIch
Spontan fällt mir folgendes ein:
Verfasst: Montag 28. Dezember 2009, 00:02
von Defnull
"Unicode" hat eigentlich keine feste Byte-Repräsentation. Die interne Repräsentation von Unicode-Strings ist Plattform-abhängig und sollte niemals als nicht-unicode-objekt auf tauchen. Was du da hast, ist ein irgendwie codierter String, den du dekodieren musst.
Tipp: \xfc ist latin1 (oder latin9) für 'ü'.
Verfasst: Montag 28. Dezember 2009, 00:14
von jbs
Defnull hat geschrieben:"Unicode" hat eigentlich keine feste Byte-Repräsentation. Die interne Repräsentation von Unicode-Strings ist Plattform-abhängig und sollte niemals als nicht-unicode-objekt auf tauchen. Was du da hast, ist ein irgendwie codierter String, den du dekodieren musst.
Tipp: \xfc ist latin1 (oder latin9) für 'ü'.
Ah. Nun gehts

. Danke.
Ich hatte bei \xfc immer an utf-8 gedacht.