XML Taginhalt fehler bei Ausgabe
Verfasst: Dienstag 6. Dezember 2011, 18:12
Hi
ich beschäftige mich grade mit XML für meine Thesis.
Die XML wird mit SAX ausgelesen das klappt auch alles soweit ganz gut nur hab ich bei einer bestimmten kombination im Taginhalt eine fehlerhafte Ausgabe.
das attribut href kann ich mir ohne probleme ausgeben lassen
aber wenn ich den Inhalt ausgeben will kommen mehrere Ergebnisse
https://bugzilla.redhat.com/attachment.cgi?id=473779
https://bugzilla.redhat.com/attachment.cgi?id=473779&
https://bugzilla.redhat.com/attachment.cgi?id=473779&action=diff
d.h. sobald im Inhalt ein & Zeichen steht macht er mir ne neue Ausgaben
gibt es irgend eine Funktion oder Trick, dass ich die komplette URL bekomme?
Vielen Dank im Vorraus
ich beschäftige mich grade mit XML für meine Thesis.
Die XML wird mit SAX ausgelesen das klappt auch alles soweit ganz gut nur hab ich bei einer bestimmten kombination im Taginhalt eine fehlerhafte Ausgabe.
Code: Alles auswählen
<vuln:reference href="https://bugzilla.redhat.com/attachment.cgi?id=473779&action=diff"
xml:lang="en">
https://bugzilla.redhat.com/attachment.cgi?id=473779&action=diff
</vuln:reference>
aber wenn ich den Inhalt ausgeben will kommen mehrere Ergebnisse
https://bugzilla.redhat.com/attachment.cgi?id=473779
https://bugzilla.redhat.com/attachment.cgi?id=473779&
https://bugzilla.redhat.com/attachment.cgi?id=473779&action=diff
d.h. sobald im Inhalt ein & Zeichen steht macht er mir ne neue Ausgaben
Code: Alles auswählen
def startElement(self, name, attributes ):
...
if name == "vuln:reference":
self.ref_href = attributes["href"]
self.active = name
print("href: ",self.ref_href)
def characters(self, data):
if self.active == "vuln:reference":
self.buffer += data
print("vuln ref: ", self.buffer)
Vielen Dank im Vorraus