Seite 1 von 2

XML-Datei auslesen

Verfasst: Mittwoch 12. Dezember 2018, 21:24
von yuyu
Hallo Forum,

ich möchte gerne aus einer XML Eingabedatei viele Daten auslesen und dann in eine Textdatei schreiben.

### Eingabedatei ###
<Name>Max</Name>
<Age>23</Age>
<Number>1234567</Number>
<Name>Jenny</Name>
<Age>19</Age>
<Number>7654321</Number>
### Eingabedatei ###


### Textdatei###
Name: Max
Age: 23
Number: 1234567

Name: Jenny
Age: 19
Number: 7654321
### Textdatei###

Habe vorher nix mit Python gemacht, könntet ihr mir bitte helfen :?:

Re: XML-Datei auslesen

Verfasst: Mittwoch 12. Dezember 2018, 22:12
von sparrow
Wie lautet denn deine konkrete Frage?
Was hast du probiert, was geht nicht?

Re: XML-Datei auslesen

Verfasst: Mittwoch 12. Dezember 2018, 22:30
von __blackjack__
@yuyu: Für Grundlagen von Python gibt es in der Python-Dokumentation ein Tutorial, welches Du durcharbeiten kannst.

Wenn die Grundlagen da sind, könntest Du mal in die Standardbibliothek schauen, was es da für XML an Modulen gibt. Insbesondere `xml.etree`.

Re: XML-Datei auslesen

Verfasst: Mittwoch 12. Dezember 2018, 23:03
von Sirius3
@yuyu: die Eingbedatei ist kein XML, und sieht auch sonst nicht wie schönes XML aus. Wie sieht das XML wirklich aus, und woher kommt das?

Re: XML-Datei auslesen

Verfasst: Donnerstag 13. Dezember 2018, 20:35
von yuyu
das ist nur ein kleines Beispiel, natürlich muss das so aussehen:
<data>
<Name>Max</Name>
<Age>23</Age>
<Number>1234567</Number>
<Name>Jenny</Name>
<Age>19</Age>
<Number>7654321</Number>
<\data>

Re: XML-Datei auslesen

Verfasst: Donnerstag 13. Dezember 2018, 20:58
von __deets__
Abgesehen davon, dass das schließende Tag falsch ist, bringt uns das ja auch nicht weiter. Was hast du bisher probiert, um das XML einzulesen?

Re: XML-Datei auslesen

Verfasst: Donnerstag 13. Dezember 2018, 21:07
von Sirius3
... was immer noch kein gültiges XML ist. Die Frage ist, warum Name, Age, Number immer wiederholt werden, ohne irgendeine Unterstrukturierung.

Re: XML-Datei auslesen

Verfasst: Donnerstag 13. Dezember 2018, 22:57
von yuyu
besteht die Hoffnung einfach nur nach den Tags zu suchen, ohne den ganzen XML-Tree vorzugeben?

Re: XML-Datei auslesen

Verfasst: Donnerstag 13. Dezember 2018, 23:10
von Sirius3
Hast Du Dir schon die Dokumentation zu ElementTree durchgelesen? Was hast Du schon versucht? Code? Wo gibt es konkret ein Problem?

Re: XML-Datei auslesen

Verfasst: Donnerstag 13. Dezember 2018, 23:13
von __deets__
Hoffnung besteht ja immer. Und natürlich kann ich mir 3 Tage frei nehmen, und ein 100seitiges Traktat über Dutzende formen von XML Dokumenten, von denen ich hoffe, dass sie deinem Problem nah kommen, und deren programmatische Behandlung, verfassen.

Alternativ könntest du deine Hausaufgaben machen, und konkrete, gültige Dokumente zeigen, damit man beurteilen kann, ob und wie das geht. Und welchen Code du schon hast.

Das ganze kostet dann alle Beteiligten weniger Zeit & nerven.

Re: XML-Datei auslesen

Verfasst: Freitag 14. Dezember 2018, 10:19
von snafu
Hier ein Beispiel zur besseren Orientierung:

Code: Alles auswählen

from xml.etree import ElementTree

source = """<data>
<Name>Max</Name>
<Age>23</Age>
<Number>1234567</Number>
<Name>Jenny</Name>
<Age>19</Age>
<Number>7654321</Number>
</data>"""

root = ElementTree.fromstring(source)
for node in root:
    print(f'{node.tag}: {node.text}')
    # Bei Python < 3.6 dies nehmen:
    # print('{0.tag}: {0.text}'.format(node))
Wie meine Vorposter schon schrieben, bräuchte man für eine genauere Hilfe schon die tatsächliche Struktur der XML-Daten. Aber vielleicht reicht das Beispiel ja schon.

Re: XML-Datei auslesen

Verfasst: Freitag 14. Dezember 2018, 20:34
von yuyu
Danke, funktioniert. Kann ich die Ausgabe mit einer If-Abfrage steuern, also nur bei bestimmten Tag-Elementen?

Re: XML-Datei auslesen

Verfasst: Freitag 14. Dezember 2018, 21:32
von __deets__
Ja.

Re: XML-Datei auslesen

Verfasst: Freitag 14. Dezember 2018, 21:39
von snafu
Meinst du so?

Code: Alles auswählen

from xml.etree import ElementTree

source = """<data>
<Name>Max</Name>
<Age>23</Age>
<Number>1234567</Number>
<Name>Jenny</Name>
<Age>19</Age>
<Number>7654321</Number>
</data>"""

root = ElementTree.fromstring(source)
for name in root.findall('Name'):
    print(name.text)
Ansonsten geht natürlich auch:

Code: Alles auswählen

for node in root:
    if node.tag == 'meintag':
        # ...
Würde ich aber nur bei verschiedenen Tags machen. Ansonsten ist findall() schon die bessere Wahl.

Re: XML-Datei auslesen

Verfasst: Samstag 15. Dezember 2018, 15:49
von yuyu
Hallo,
lassen sich Name, Age und Number auch in beliebigen Unterstrukturen finden? Folgendes ergibt keine Ausgabe:

import xml.etree.ElementTree as ET
tree = ET.parse('c:/myfile.xml')
root = tree.getroot()

for child in root.findall('Minwert'):
print (child.text)

Re: XML-Datei auslesen

Verfasst: Samstag 15. Dezember 2018, 16:10
von __blackjack__
@yuyu: Ja lassen sie sich. Lies doch einfach mal die Dokumentation zum `ElementTree`-Modul. Die fängt mit einem Tutorial an.

Re: XML-Datei auslesen

Verfasst: Samstag 15. Dezember 2018, 17:27
von snafu
@yuyu: findall() unterstützt auch XPath-Syntax. Das ist für komplexere Abfragen meist besser geeignet, anstatt den Baum händisch zu durchlaufen. Im schon erwähnten Tutorial findest du die entsprechende Stelle hier: https://docs.python.org/3/library/xml.e ... th-support

Re: XML-Datei auslesen

Verfasst: Samstag 15. Dezember 2018, 18:17
von yuyu
Tutorial durchgegangen.

Folgendes Beispiel funktioniert am kleinen Beispiel, aber nicht am größerern Beispiel.

Code: Alles auswählen

import xml.etree.ElementTree as ET
tree = ET.parse('c:/input.xml')

for elem in tree.iter():
    if elem.tag == 'Name':
        print (elem.text)
    if elem.tag == 'Age':
        print (elem.text)
Ich habe ein Root mit vielen Unterstrukturen.

Re: XML-Datei auslesen

Verfasst: Samstag 15. Dezember 2018, 18:40
von snafu
yuyu hat geschrieben: Samstag 15. Dezember 2018, 18:17 Tutorial durchgegangen.
Wohl eher überflogen als durchgegangen in der kurzen Zeit...

Wie schon erwähnt sind komplexe Abfragen mit der XPath-Syntax möglich:

Code: Alles auswählen

# Alle Namen auf allen Ebenen
names = root.findall('.//Name')

# Alle Altersangaben auf allen Ebenen
ages = root.findall('.//Age')
Im Gegensatz zu deinem Ansatz werden hierbei nicht nur die direkten Kind-Elemente angeschaut, sondern auch die tiefer verschachtelten.

Findet sich beim Link aus meinem vorherigen Post in der Tabelle (Beschreibung in der vierten Spalte). Sofern man da mal reinschauen möchte...

Re: XML-Datei auslesen

Verfasst: Samstag 15. Dezember 2018, 20:32
von yuyu
Hallo,
mit:

Code: Alles auswählen

import xml.etree.ElementTree as ET
tree = ET.parse('c:/data.xml')
root = tree.getroot()

names = root.findall('.//Name')
print (names)
bekomme ich und nicht den text vom tag:
[<Element 'Name' at 0x009116F0>, <Element 'Name' at 0x009117B0>, <Element 'Name' at 0x00911870>]

Wenn ich das gleiche auf das eigentliche XML loslasse, dann sehe ich nur zwei Zeiche in der Ausgabe: [ ]