Variablen von Internetseiten auslesen

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
FSXTim
User
Beiträge: 6
Registriert: Donnerstag 13. Dezember 2012, 16:08

Hallo,

ich möchte Texte bzw. Variablen von Internetseiten auslesen.

Konkret geht es um folgende Seite:
http://live.glidernet.org/
Hier kann man rechts in der Liste ein Flugzeug auswählen und es öffnet sich ein Fenster mit diversen Daten.
Und genau diese Daten (Type, Model, Altitude usw.) möchte ich auslesen, um meinen eigenen Flugweg nachzuvollziehen.

Mein bisheriger Ansatz beschränkt sich auf folgenden Code:

Code: Alles auswählen

import urllib.request

user_agent = 'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.0.7) Gecko/2009021910 Firefox/3.0.7'

url = "http://live.glidernet.org/"
headers = {'User-Agent':user_agent} 

request = urllib.request.Request(url, None, headers)
response = urllib.request.urlopen(request)
data = response.read()
print(data)
Damit kann ich aber leider nur den HTML-Quellcode auslesen.
Nach umfangreicher Recherche bin ich bisher noch zu keiner Lösung gekommen, um die Variablen auszulesen.

Gruß
nezzcarth
User
Beiträge: 1792
Registriert: Samstag 16. April 2011, 12:47

Na ja, im HTML-Quelltext der Einstiegsseite steht kaum etwas, weil der Großteil dieser Seite dynamisch per Java Script erzeugt wird. Hilft dir das hier weiter http://live.glidernet.org/lxml.php ?
FSXTim
User
Beiträge: 6
Registriert: Donnerstag 13. Dezember 2012, 16:08

Genau das habe ich gesucht, danke!

Wie bist du auf die Seite gekommen? Ist ja nirgens verlinkt ...
nezzcarth
User
Beiträge: 1792
Registriert: Samstag 16. April 2011, 12:47

FSXTim hat geschrieben:Genau das habe ich gesucht, danke!

Wie bist du auf die Seite gekommen? Ist ja nirgens verlinkt ...
Die steht im Seitenquellentext in Zeile 23. ('var cxml = "lxml.php";')
FSXTim
User
Beiträge: 6
Registriert: Donnerstag 13. Dezember 2012, 16:08

Habs jetzt auch gefunden, danke dir!
Antworten