Seite 1 von 1
Japanische Schriftzeichen aus unicode gewinnen
Verfasst: Samstag 21. Mai 2011, 16:07
von Boa
Hi,
Ich habe einen Unicode String u'\u30af\u30a4\u30c3\u30af\u30b9\u30bf\u30fc\u30c8\u30ac\u30a4\u30c9'.
Diesen möchte ich in die äquivalenten Schriftzeichen 'クイックスタートガイド' übersetzen.
Wie kann ich das bewerkstelligen?
MfG,
Boa
Re: Japanische Schriftzeichen aus unicode gewinnen
Verfasst: Samstag 21. Mai 2011, 16:18
von cofi
Eh, so?
Code: Alles auswählen
In [4]: print u'\u30af\u30a4\u30c3\u30af\u30b9\u30bf\u30fc\u30c8\u30ac\u30a4\u30c9'
クイックスタートガイド
Die Schriftzeichen "entstehen" durch die Darstellung durch einen passenden Font, nicht durch die interne Repräsentation, da geht nicht mehr als Unicode.
Also was hast du vor?
Re: Japanische Schriftzeichen aus unicode gewinnen
Verfasst: Samstag 21. Mai 2011, 17:24
von Boa
Hallo,
Danke für die Antwort. Ich dachte das interne Fromat würde sich unterscheiden. Ich habe die Zeichenkette in einer Liste, welche via print die Zeichen mit \uwxyz usw. darstellt. In der Liste habe ich nun nach der Zeichenkette, die via print mit den tatsächlichen Symbolen ausgegeben wird, gesucht. Da die Suche erfolglos war und die Zeichenketten jeweils unsterschiedlich ausgegeben wurden dachte ich, dass sie auch intern anders aussehen müssen. Das stimmt aber nur in so fern, dass die gesuchte Zeichenkette das lokale Format hatte. Der gesuchte String muss vermutlich nur in das entsprechende Unicode Format gewandelt werden.
In Code:
Code: Alles auswählen
'/Sample Documents/SugarSync クイックスタートガイド.pdf' in [u'/Sample Documents/SugarSync \u30af\u30a4\u30c3\u30af\u30b9\u30bf\u30fc\u30c8\u30ac\u30a4\u30c9.pdf']
u'/Sample Documents/SugarSync クイックスタートガイド.pdf' in [u'/Sample Documents/SugarSync \u30af\u30a4\u30c3\u30af\u30b9\u30bf\u30fc\u30c8\u30ac\u30a4\u30c9.pdf']
Thx,
Boa
Re: Japanische Schriftzeichen aus unicode gewinnen
Verfasst: Samstag 21. Mai 2011, 17:39
von Boa
Also die Lösung ist
Code: Alles auswählen
unicode( '/Sample Documents/SugarSync クイックスタートガイド.pdf', "utf8" ) in [u'/Sample Documents/SugarSync \u30af\u30a4\u30c3\u30af\u30b9\u30bf\u30fc\u30c8\u30ac\u30a4\u30c9.pdf']
Re: Japanische Schriftzeichen aus unicode gewinnen
Verfasst: Samstag 21. Mai 2011, 18:00
von cofi
Besser:
Code: Alles auswählen
u'/Sample Documents/SugarSync クイックスタートガイド.pdf' in [u'/Sample Documents/SugarSync \u30af\u30a4\u30c3\u30af\u30b9\u30bf\u30fc\u30c8\u30ac\u30a4\u30c9.pdf']
mit einem utf-8 Encoding-Cookie, genauso wie du besser auch das 2. auf ersteres umstellen solltest.