Wert zwischen/nach bestimmter Zeichenkette ausgeben
Verfasst: Dienstag 17. Dezember 2019, 19:21
Hallo,
ich versuche mich gerade ein wenig an Python. Ich habe Python 2.7.17 auf meinem Laptop und eine Datei (xxx.html) aus der ich gerne bestimmte Daten ausgeben lassen würde. Es gibt in der Datei bspw. Zeilen in dieser Art:
Dort würde ich mir nun gerne XXX und YYY ausgeben lassen. Bis auf die line-Angabe ist das ansonsten auch immer gleich aufgebaut.
Oder diese zwei Zeilen, die bis auf die line-Angabe auch immer gleich aufgebaut ist, bis eben auf die zwei Werte die ich gerne extrahieren würde, Gewicht und der entsprechende Wert dazu:
Am Ende soll dann eine Ausgabe stehen wie:
Nun habe ich die Datei mal eingelesen mit:
Aber für weiteres fehlt mir irgendwie der Ansatz. Ich kann ja irgendwie damit arbeiten, dass ich sage, dass er mir den Wert zwischen dieser und jener Zeichenkette ausgeben soll. Bspw. gib mir den Wert bis zum Leerzeichen der nach "<span>Wagen | " kommt. Aber wie mache ich das? Muss ich dafür irgendwie mit regulären Ausdrücken arbeiten? Eigentlich dachte ich, dass sich da einiges im Internet finden lassen sollte, aber entweder suche ich falsch oder ich kann das gefundene irgendwie nicht auf mein Problem adaptieren. Hoffe nun, dass ich hier auf die richtige Fährte komme...
ich versuche mich gerade ein wenig an Python. Ich habe Python 2.7.17 auf meinem Laptop und eine Datei (xxx.html) aus der ich gerne bestimmte Daten ausgeben lassen würde. Es gibt in der Datei bspw. Zeilen in dieser Art:
Code: Alles auswählen
<span id="line12"></span> </span><span><<span class="start-tag">title</span>></span><span>Wagen | XXX <span class="entity"><span>&</span>gt;</span><span class="entity"><span>&</span>gt;</span> befindet sich zurzeit am Standort YYY</span><span></<span class="end-tag">title</span>></span><span>
Oder diese zwei Zeilen, die bis auf die line-Angabe auch immer gleich aufgebaut ist, bis eben auf die zwei Werte die ich gerne extrahieren würde, Gewicht und der entsprechende Wert dazu:
Code: Alles auswählen
<span id="line740"></span> </span><span><<span class="start-tag">div</span> <span class="attribute-name">class</span>="<a class="attribute-value">pcbc-user-data-line-left</a>"></span><span>Gewicht</span><span></<span class="end-tag">div</span>></span><span>
<span id="line741"></span> </span><span><<span class="start-tag">div</span> <span class="attribute-name">class</span>="<a class="attribute-value">pcbc-user-data-line-right-divided</a>"></span><span>15 t</span><span></<span class="end-tag">div</span>></span><span>
Code: Alles auswählen
XXX in YYY
Gewicht: 15 t
Code: Alles auswählen
datei = open("xxx.html", "r")
x = datei.read()
datei.close()