ich beschäftige mich grade mit XML für meine Thesis.
Die XML wird mit SAX ausgelesen das klappt auch alles soweit ganz gut nur hab ich bei einer bestimmten kombination im Taginhalt eine fehlerhafte Ausgabe.
Code: Alles auswählen
<vuln:reference href="https://bugzilla.redhat.com/attachment.cgi?id=473779&action=diff"
xml:lang="en">
https://bugzilla.redhat.com/attachment.cgi?id=473779&action=diff
</vuln:reference>
aber wenn ich den Inhalt ausgeben will kommen mehrere Ergebnisse
https://bugzilla.redhat.com/attachment.cgi?id=473779
https://bugzilla.redhat.com/attachment.cgi?id=473779&
https://bugzilla.redhat.com/attachment.cgi?id=473779&action=diff
d.h. sobald im Inhalt ein & Zeichen steht macht er mir ne neue Ausgaben
Code: Alles auswählen
def startElement(self, name, attributes ):
...
if name == "vuln:reference":
self.ref_href = attributes["href"]
self.active = name
print("href: ",self.ref_href)
def characters(self, data):
if self.active == "vuln:reference":
self.buffer += data
print("vuln ref: ", self.buffer)
Vielen Dank im Vorraus