Ich habe ein Problem mit verschiedenen XML-Dateien, die ich parsen will. Zunächst bestand mein Problem darin, dass ich Fehlermeldungen bei Umlauten bekam. Das altbekannte
Code: Alles auswählen
'ascii' codec can't encode character u'\xf6'...
Nachdem ich das gemacht habe, kann ich jetzt gar nicht mehr parsen. Meine XML-Datei fängt so an:
Code: Alles auswählen
<?xml version="1.0" encoding="ISO-8859-1" standalone="no"?>
Reines validieren der Datei gegen die DTD gibt:
Code: Alles auswählen
encoding 'iso-8859-1' conflicts with autodetected encoding
Code: Alles auswählen
SAXParseException: encoding specified in XML declaration is incorrect
Code: Alles auswählen
from xml.sax import make_parser
ch=eigener_Handler()
parser=make_parser()
parser.setContentHandler(ch)
parser.parse(datei)
Danke schon mal für Vorschläge!
Gruß,
Michael