Zahl auslesen
Verfasst: Sonntag 24. August 2008, 20:09
Hallo!
Ich möchte von der Seite http://flug.ab-in-den-urlaub.de/ die Flugpreise für verschiedene Tage und Daten auswerten.
Sehr hilfreich dabei ist die Bedeutung des Suchlinks:
"http://flug.ab-in-den-urlaub.de/" +
"itineraries.html?sid=df7db7b1ee91f08b3ea38d83fc6dd032&ibeParam%5BflightType%5D=OW&
ibeParam%5BaccDep%5D=TXL <<< Abflugort
&ibeParam%5BaccArr%5D=FRA <<< Zielort
&ibeParam%5BaccDepMulti%5D=TRUE&ibeParam%5BaccArrMulti%5D=FALSE
&ibeParam%5BdepCity%5D=Huhu <<< Abflugort, der in der Suchzeile steht, aber für das Ergebnis unerheblich ist
&ibeParam%5BarrCity%5D=Hallo <<< Zielort, der in der Suchzeile steht
&ibeParam%5BdepartureDate%5D=20.09.2008 <<< Datum
&ibeParam%5BreturnDate%5D=&ibeParam%5BdepartureTimeRange%5D=&ibeParam%5BreturnTimeRange%5D=&ibeParam%5BpaxAdt%5D=1&ibeParam%5BpaxChd%5D=0
&ibeParam%5BpaxInf%5D=0&ibeParam%5BnonStop%5D=FALSE
&ibeParam%5BcabinClass%5D=Y&ibeParam%5BdepAirline%5D=&ibeParam%5BdepartureDatetime%5D=&ibeParam%5BreturnDatetime%5D=&ibeParam%5BclickAndMix%5D=Flight&Schnellsuche="
Diese Daten verändere ich dann entsprechend und lasse mir die Suchergebnisse ausgeben.
Das Auslesen wollte ich einfach mit
machen.
Doch erscheint bei
nur der html-Code der Seite, indem jedoch nicht die Flugdaten, sondern nur das Seitenlayout enthalten sind.
Wie komme ich nun an die Daten?
Meine erste Idee war, mit Sendkeys den Seitentext im Browser in die Zwischenablage zu kopieren
und dann mit
die Zwischenablage auszulesen und diese dann nach den Flugdaten zu durchsuchen, die dann dort enthalten sind.
Es würde funktionieren, aber das geht bestimmt auch noch eleganter.
Fällt euch was anderes ein?
Gruß
Paul
Ich möchte von der Seite http://flug.ab-in-den-urlaub.de/ die Flugpreise für verschiedene Tage und Daten auswerten.
Sehr hilfreich dabei ist die Bedeutung des Suchlinks:
"http://flug.ab-in-den-urlaub.de/" +
"itineraries.html?sid=df7db7b1ee91f08b3ea38d83fc6dd032&ibeParam%5BflightType%5D=OW&
ibeParam%5BaccDep%5D=TXL <<< Abflugort
&ibeParam%5BaccArr%5D=FRA <<< Zielort
&ibeParam%5BaccDepMulti%5D=TRUE&ibeParam%5BaccArrMulti%5D=FALSE
&ibeParam%5BdepCity%5D=Huhu <<< Abflugort, der in der Suchzeile steht, aber für das Ergebnis unerheblich ist
&ibeParam%5BarrCity%5D=Hallo <<< Zielort, der in der Suchzeile steht
&ibeParam%5BdepartureDate%5D=20.09.2008 <<< Datum
&ibeParam%5BreturnDate%5D=&ibeParam%5BdepartureTimeRange%5D=&ibeParam%5BreturnTimeRange%5D=&ibeParam%5BpaxAdt%5D=1&ibeParam%5BpaxChd%5D=0
&ibeParam%5BpaxInf%5D=0&ibeParam%5BnonStop%5D=FALSE
&ibeParam%5BcabinClass%5D=Y&ibeParam%5BdepAirline%5D=&ibeParam%5BdepartureDatetime%5D=&ibeParam%5BreturnDatetime%5D=&ibeParam%5BclickAndMix%5D=Flight&Schnellsuche="
Diese Daten verändere ich dann entsprechend und lasse mir die Suchergebnisse ausgeben.
Das Auslesen wollte ich einfach mit
Code: Alles auswählen
html=urlopen('URL').read()
daten=findall('Flugdauer.*<inklusive',html)
Doch erscheint bei
Code: Alles auswählen
print html
Wie komme ich nun an die Daten?
Meine erste Idee war, mit Sendkeys den Seitentext im Browser in die Zwischenablage zu kopieren
Code: Alles auswählen
SendKeys("""\
^a
^c
""", 0.1)
Code: Alles auswählen
import win32clipboard as a
import win32con,re
a.OpenClipboard()
ablage=a.GetClipboardData(win32con.CF_TEXT)
print ablage
Es würde funktionieren, aber das geht bestimmt auch noch eleganter.
Fällt euch was anderes ein?
Gruß
Paul