1. Wenn eine Datei UTF-8 ist und ich gebe 8895-1 als Zeichensatz an, dann wird das UTF-8 als 8895-1 interpretiert, richtig?
2. Wenn ich kein Encoding angebe, interpretiert Python die File standartmäßig als Unicode?
3. Unicode ist einfach eine Tabelle mit allen möglichen Zeichen und UTF-8 eine Möglichkeit diese digital zu speichern? (Da kann irgendwas nicht stimmen, aber das schlussfolgere ich wenn ich bei Wikipedia lese:
)UTF-8 (Abk. für 8-bit Unicode Transformation Format) ist die am weitesten verbreitete Kodierung für Unicode-Zeichen.
4. Ich habe gelesen 1 Zeichen braucht 1Byte, aber nur wenn man es in ASCII kodiert, oder? Bei UTF-8 nur wenn das Zeichen im ASCII-Code vorkommt, richtig? (also sich als 1 Byte darstellen lässt (also <128))
5. Warum wird folgende Exception geworfen
wenn ich ohne ein Encoding anzugeben die DateiSyntaxError: Non-ASCII character
mit Sonderzeichen ausführen möchte? Was hat das mit ASCII zu tuen? Ich dachte Python nimmt standartmäßig alles Unicode?
Danke für die Antwort im voraus
Dr.Miles[/quote]