Hallo,
ich suche einen einfachen Weg String- und Unicode-Zeichenketten so zu kodieren das ich immer eine String-Zeichenkette mit der selben kodierung erhalte. In diesen Zeichenketten sind auch viele Sonderzeichen enthalten, was mir etwas Probleme bereitet.
Kann mir da mal jemand helfen?
mfg
microkernel
Allgemeine Kodierung
- microkernel
- User
- Beiträge: 271
- Registriert: Mittwoch 10. Juni 2009, 17:27
- Wohnort: Frankfurt
- Kontaktdaten:
utf-8?
the more they change the more they stay the same
- Hyperion
- Moderator
- Beiträge: 7478
- Registriert: Freitag 4. August 2006, 14:56
- Wohnort: Hamburg
- Kontaktdaten:
Du musst ja zum Umcodieren von Byte-Strings eh den "Umweg" über Unicode-Strings gehen. Wieso willst Du dann auf Byte-Strings arbeiten?
Prinzipiell musst Du die Strings einfach dekodieren, sofern sie als Byte-Strings vorliegen:
Prinzipiell musst Du die Strings einfach dekodieren, sofern sie als Byte-Strings vorliegen:
Code: Alles auswählen
data = []
s = "Hallöle Welt"
u = u"Hallöle Welt"
# wenn s in iso-8859-15 kodiert ist:
data.append(s.decode("iso-8859-15").encode("utf-8"))
# und wenn Unicode bereits vorliegt:
data.append(u.encode("utf-8"))