ich habe eine Frage: Wie kann ich den Inhalt aller "Untertags" herausfiltern, wenn mein XML-wie folgt aufgebaut ist:
Code: Alles auswählen
<art_text>
<EditText><text>blablabalahhdjsgff</text><br/></EditText>
<EditText><text>hshdjsdfhdsfhudsfhxcbcxbhdf</text><br/></EditText>
<EditText>Abschluss</EditText>
</art_text>
Code: Alles auswählen
sections = article.find("art_text")
for sec in sections:
text = ""
if sec.tag == "EditText":
for s in sec:
if s.text and re.search(r"\S", s.text):
text = s.text.rstrip()
if sec.text and re.search(r"\S", sec.text):
text = sec.text.rstrip()
yield (text, {"Editorial" : "True"})
Danke für die Hilfe.