ElementTree iter escape?
Verfasst: Samstag 23. November 2013, 07:46
Hallo,
ich soll zur Zeit relativ große XML-Dateien parsen (von 7MB bis 50MB). Dabei handelt sich hauptsächlich um User generated content. Jetzt habe ich allerdings das Problem, dass sich in diesen Datein anscheinend ungültige XML Zeichen befinden und cElementTree deshalb Fehlermeldungen aufwirft. Auf Stackoverflow hatte ein User schon einmal exakt das gleiche Problem: http://stackoverflow.com/questions/1304 ... lementtree. Ihm wurde dort empfohlen diese Zeichen zu escapen. Da ich meine Dateien allerdings mit iterparse parse und sie nicht vorher komplett in den Arbeitsspeicher laden will, weiß ich gerade nicht, wie ich das Problem lösen kann.
Kann mir da jemand weiter helfen?
LG
microkernel
ich soll zur Zeit relativ große XML-Dateien parsen (von 7MB bis 50MB). Dabei handelt sich hauptsächlich um User generated content. Jetzt habe ich allerdings das Problem, dass sich in diesen Datein anscheinend ungültige XML Zeichen befinden und cElementTree deshalb Fehlermeldungen aufwirft. Auf Stackoverflow hatte ein User schon einmal exakt das gleiche Problem: http://stackoverflow.com/questions/1304 ... lementtree. Ihm wurde dort empfohlen diese Zeichen zu escapen. Da ich meine Dateien allerdings mit iterparse parse und sie nicht vorher komplett in den Arbeitsspeicher laden will, weiß ich gerade nicht, wie ich das Problem lösen kann.
Kann mir da jemand weiter helfen?
LG
microkernel