Mit python 2 aus Datei mit Umlauten in Python-Liste lesen?
@mutetella: Das wird zum Beispiel bei Dateinamen unter MacOS verwendet. Die sind AFAIK alle so normalisiert das keine „precomposed”-Zeichen verwendet werden. Also auch bei Umlauten nicht.
@mutetella: Unicode erlaubt es, Zeichen aus mehreren Teilen zusammenzusetzen. Viele Sprachen haben ja Punkte, Striche und Haken über oder unter normalen Buchstaben. Für die geläufigsten Kombinationen gibt es bereits eigene Zeichen. Für das Zusammenbauen ist nicht der Codec verantwortlich, sondern derjenige, der die Zeichen darstellt. Bei Python gibt es im Übrigen »unicodedata.normalize« um zwischen den verschiedenen Repräsentationsformen zu konvertieren.