Ich möchte von der Seite http://flug.ab-in-den-urlaub.de/ die Flugpreise für verschiedene Tage und Daten auswerten.
Sehr hilfreich dabei ist die Bedeutung des Suchlinks:
"http://flug.ab-in-den-urlaub.de/" +
"itineraries.html?sid=df7db7b1ee91f08b3ea38d83fc6dd032&ibeParam%5BflightType%5D=OW&
ibeParam%5BaccDep%5D=TXL <<< Abflugort
&ibeParam%5BaccArr%5D=FRA <<< Zielort
&ibeParam%5BaccDepMulti%5D=TRUE&ibeParam%5BaccArrMulti%5D=FALSE
&ibeParam%5BdepCity%5D=Huhu <<< Abflugort, der in der Suchzeile steht, aber für das Ergebnis unerheblich ist
&ibeParam%5BarrCity%5D=Hallo <<< Zielort, der in der Suchzeile steht
&ibeParam%5BdepartureDate%5D=20.09.2008 <<< Datum
&ibeParam%5BreturnDate%5D=&ibeParam%5BdepartureTimeRange%5D=&ibeParam%5BreturnTimeRange%5D=&ibeParam%5BpaxAdt%5D=1&ibeParam%5BpaxChd%5D=0
&ibeParam%5BpaxInf%5D=0&ibeParam%5BnonStop%5D=FALSE
&ibeParam%5BcabinClass%5D=Y&ibeParam%5BdepAirline%5D=&ibeParam%5BdepartureDatetime%5D=&ibeParam%5BreturnDatetime%5D=&ibeParam%5BclickAndMix%5D=Flight&Schnellsuche="
Diese Daten verändere ich dann entsprechend und lasse mir die Suchergebnisse ausgeben.
Das Auslesen wollte ich einfach mit
Code: Alles auswählen
html=urlopen('URL').read()
daten=findall('Flugdauer.*<inklusive',html)
Doch erscheint bei
Code: Alles auswählen
print html
Wie komme ich nun an die Daten?
Meine erste Idee war, mit Sendkeys den Seitentext im Browser in die Zwischenablage zu kopieren
Code: Alles auswählen
SendKeys("""\
^a
^c
""", 0.1)
Code: Alles auswählen
import win32clipboard as a
import win32con,re
a.OpenClipboard()
ablage=a.GetClipboardData(win32con.CF_TEXT)
print ablage
Es würde funktionieren, aber das geht bestimmt auch noch eleganter.
Fällt euch was anderes ein?
Gruß
Paul