Die aktuelle Python-Version in OSX Mountain Lion 10.8 ist 2.7. In dieser Version gibt es, obwohl wir schon im Jahre 2013 leben, immer noch Unterschiede zwischen ascii-Strings und Unicode-Strings. Ich entwickle in Eclipse mit PyDev und Python 3.3, lasse das Ergebnis dann aber mit Python 2.7 unter OSX laufen und laufend meckert Python wegen ascii-Codierungsfehlern. Manchmal denke ich, dass es immer noch amerikanische Entwickler gibt, die gar nicht wissen, dass es andere Sprachen außer "Ascii-English" gibt.
Aber auch in Python 3.3 sieht es noch nicht so gut aus. Zum Beispiel das ganz normale č wie in česky macht mir große Probleme. Man kann es unicode-mäßig als u'c\u030c', d. h. "c kombiniert mit dem Haček", aber auch als u'\u010d', d. h. "c mit Haček" kodieren. Manche Browser, Programme oder Betriebssysteme machen es so, manche so, manchmal hängt es auch einfach an der Art der Tastatureingabe ab. Bloß wenn ich in Python
vergleiche. kann mir passieren, dass dann False raus kommt. Wie kann man dieses Verhalten denn umgehen. Ich wünsche mir:
Übrigens gilt dies auch für é und andere Kombinationen wie ñ, da gibt es immer ein Unicode-Zeichen und eine kombinierte Form
Gruß fiveyears