ewig unicode

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
trueshanti
User
Beiträge: 2
Registriert: Sonntag 25. Juni 2006, 17:10

Montag 26. Juni 2006, 11:45

Hallo ich habe ein Problem in einem meiner Skripte und habe es auf folgendes reduziert ..

ein funktion ( BeautifulSoup ) liefert mir folgenden string .. es gibt keinen weg dies innerhalb der funktion zu definieren

Code: Alles auswählen

>>> ttt
u'S\xc3\xbc\xc3\x9f\xc3er'
ich will den string aber folgend haben

Code: Alles auswählen

>>> ttt
'S\xc3\xbc\xc3\x9f\xc3er'
wie kann ich das möglichst unkompliziert machen ?

ist vielleicht eine dummy-frage aber was solls

thanks4reply

-c-
Leonidas
Administrator
Beiträge: 16024
Registriert: Freitag 20. Juni 2003, 16:30
Kontaktdaten:

Montag 26. Juni 2006, 12:54

Code: Alles auswählen

ttt = ttt.encode('latin-1')
My god, it's full of CARs! | Leonidasvoice vs Modvoice
mitsuhiko
User
Beiträge: 1790
Registriert: Donnerstag 28. Oktober 2004, 16:33
Wohnort: Graz, Steiermark - Österreich
Kontaktdaten:

Dienstag 27. Juni 2006, 06:32

trueshanti hat geschrieben:Hallo ich habe ein Problem in einem meiner Skripte und habe es auf folgendes reduziert ..

ein funktion ( BeautifulSoup ) liefert mir folgenden string .. es gibt keinen weg dies innerhalb der funktion zu definieren

Code: Alles auswählen

>>> ttt
u'S\xc3\xbc\xc3\x9f\xc3er'
Das schaut nach kaputten unicode aus. Und aus unicode ein str objekt machen macht genauso viel Sinn wie aus einem Ferrari einen Opel zu machen :roll:
TUFKAB – the user formerly known as blackbird
trueshanti
User
Beiträge: 2
Registriert: Sonntag 25. Juni 2006, 17:10

Dienstag 27. Juni 2006, 09:20

Leonidas hat geschrieben:

Code: Alles auswählen

ttt = ttt.encode('latin-1')
perfekt .. danke

lg :-)

-c-
Benutzeravatar
jens
Moderator
Beiträge: 8461
Registriert: Dienstag 10. August 2004, 09:40
Wohnort: duisburg
Kontaktdaten:

Dienstag 27. Juni 2006, 11:11

Leonidas hat geschrieben:

Code: Alles auswählen

ttt = ttt.encode('latin-1')
Wobei latin-1 wohl geraten ist, oder? Ist die Frage woher die Daten stammen ;)

CMS in Python: http://www.pylucid.org
GitHub | Open HUB | Xing | Linked in
Bitcoins to: 1JEgSQepxGjdprNedC9tXQWLpS424AL8cd
Leonidas
Administrator
Beiträge: 16024
Registriert: Freitag 20. Juni 2003, 16:30
Kontaktdaten:

Dienstag 27. Juni 2006, 18:28

jens hat geschrieben:Wobei latin-1 wohl geraten ist, oder? Ist die Frage woher die Daten stammen ;)
Jo, vollkommen garaten. Hätte auch Latin-9 oder sonstwas sein können.

Übrigens, jens, deine eingetragene E-Mail-Adresse geht (ging?) nicht, habe zwei Bounces bekommen.
My god, it's full of CARs! | Leonidasvoice vs Modvoice
Benutzeravatar
jens
Moderator
Beiträge: 8461
Registriert: Dienstag 10. August 2004, 09:40
Wohnort: duisburg
Kontaktdaten:

Dienstag 27. Juni 2006, 18:48

Leonidas hat geschrieben:Übrigens, jens, deine eingetragene E-Mail-Adresse geht (ging?) nicht, habe zwei Bounces bekommen.
Sollte wieder gehen, ich hab den Server gewechselt ;)

CMS in Python: http://www.pylucid.org
GitHub | Open HUB | Xing | Linked in
Bitcoins to: 1JEgSQepxGjdprNedC9tXQWLpS424AL8cd
Antworten