Ich habe folgenden String: "Wer hätte das ge�dacht", bzw. als Bytestring: "Wer h\xc3\xa4tte das ge\xef\xbf\xbddacht". Das inverse Fragezeichen führt in einer Anwendung zum Absturz weshalb ich es herausfiltern muss ohne dass z.B. die Umlaute beeinträchtigt werden". Das Ergebnis soll z.B. so aussehen: "Wer hätte das gedacht" oder so ""Wer hätte das ge?dacht". Wie kann ich das machen?
Wäre das eine Lösung: decode("utf-8") führt zu einem '�' = '\ufffd' anstatt '\xef\xbf\xbd'
Wie entfernt man Problemzeichen aus einem Bytestring?
-
BlackJack
@rhersel: In Unicode das Zeichen heraus filtern könnte in der Tat eine Lösung sein.
