Code: Alles auswählen
parser = ET.XMLParser()
parser.entity["nbsp"] = unichr(160)
Code: Alles auswählen
replace(unichr(160), ' ')
MfG
HWK
Code: Alles auswählen
parser = ET.XMLParser()
parser.entity["nbsp"] = unichr(160)
Code: Alles auswählen
replace(unichr(160), ' ')
Nur gut, dass ACSII nur 128 Zeichen hat. Verwende lieber Unicode(utf8), dann hast du keine Probleme mehr mit irgendwelchen Zeichen die nicht in der Kodierung enthalten sind.HWK hat geschrieben:Ich habe die HTML-Datei jetzt aber mit Encoding 'ascii' statt 'cp1252' gespeichert. Danach funktioniert es wieder, da jetzt ' ' verwendet wird.
Code: Alles auswählen
<?xml version='1.0' encoding='cp1252'?>
<html>
<head>
<meta content="text/html; charset=ascii" http-equiv="Content-Type" />