Allgemeine Kodierung

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
Benutzeravatar
microkernel
User
Beiträge: 271
Registriert: Mittwoch 10. Juni 2009, 17:27
Wohnort: Frankfurt
Kontaktdaten:

Hallo,
ich suche einen einfachen Weg String- und Unicode-Zeichenketten so zu kodieren das ich immer eine String-Zeichenkette mit der selben kodierung erhalte. In diesen Zeichenketten sind auch viele Sonderzeichen enthalten, was mir etwas Probleme bereitet.

Kann mir da mal jemand helfen?

mfg
microkernel
Dav1d
User
Beiträge: 1437
Registriert: Donnerstag 30. Juli 2009, 12:03
Kontaktdaten:

utf-8?
the more they change the more they stay the same
Benutzeravatar
Hyperion
Moderator
Beiträge: 7478
Registriert: Freitag 4. August 2006, 14:56
Wohnort: Hamburg
Kontaktdaten:

Du musst ja zum Umcodieren von Byte-Strings eh den "Umweg" über Unicode-Strings gehen. Wieso willst Du dann auf Byte-Strings arbeiten?

Prinzipiell musst Du die Strings einfach dekodieren, sofern sie als Byte-Strings vorliegen:

Code: Alles auswählen

data = []
s = "Hallöle Welt"
u = u"Hallöle Welt"
# wenn s in iso-8859-15 kodiert ist:
data.append(s.decode("iso-8859-15").encode("utf-8"))
# und wenn Unicode bereits vorliegt:
data.append(u.encode("utf-8"))
Antworten