XML-Files
Verfasst: Sonntag 16. März 2014, 11:58
Hallo zusammen,
ich habe eine Frage: Wie kann ich den Inhalt aller "Untertags" herausfiltern, wenn mein XML-wie folgt aufgebaut ist:
Konkret möchte ich den Inhalt von "EditText" herausfiltern. Ich mache zur Zeit das:
Ich komme zwar zum gesamten Inhalt, kann aber nur nur jeden zweiten tag mit "Editorial = True" beschriften. Wieso?
Danke für die Hilfe.
ich habe eine Frage: Wie kann ich den Inhalt aller "Untertags" herausfiltern, wenn mein XML-wie folgt aufgebaut ist:
Code: Alles auswählen
<art_text>
<EditText><text>blablabalahhdjsgff</text><br/></EditText>
<EditText><text>hshdjsdfhdsfhudsfhxcbcxbhdf</text><br/></EditText>
<EditText>Abschluss</EditText>
</art_text>
Code: Alles auswählen
sections = article.find("art_text")
for sec in sections:
text = ""
if sec.tag == "EditText":
for s in sec:
if s.text and re.search(r"\S", s.text):
text = s.text.rstrip()
if sec.text and re.search(r"\S", sec.text):
text = sec.text.rstrip()
yield (text, {"Editorial" : "True"})
Danke für die Hilfe.