Webscraping - Daten nachladen

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
christheturtle
User
Beiträge: 42
Registriert: Sonntag 29. September 2019, 12:36

Hallo liebes Forum!

Ich baue gerade einen Webscraper mit requests, der alle Abflüge für einen bestimmten Flughafen in einem bestimmten Zeitraum ausliest. Meine Quelle für die Daten ist https://www.flightsfrom.com. Das Problem: Wenn mehr als 50 Flüge auf der Website angezeigt werden sollen, muss man einen Button klicken, um weitere Flüge zu laden.

Meine bisherige Lösung
Ich habe herausgefunden, dass bei einem Klick auf den Button "Get more departures" ein XHR-request gestellt wird. Dadurch wird auf eine URL wie z.B. https://www.flightsfrom.com/api/schedul ... &offset=50 zugegriffen. Zurück kommt dann ein hübsches JSON mit allen Daten.

Meine Frage
Mir erscheint als jetzt einfachste Lösung, dass ich direkt über die API die Daten abfrage und die zurückgegebene JSON auswerte. Aber: Ist das eine sinnvolle Vorgehensweise? Oder übersehe ich eine einfachere Lösung, um Daten nachzuladen / einen Klick auszulösen?
__deets__
User
Beiträge: 14529
Registriert: Mittwoch 14. Oktober 2015, 14:29

Noe. Das ist schon das, was man da tun muss.
christheturtle
User
Beiträge: 42
Registriert: Sonntag 29. September 2019, 12:36

danke dir!
Benutzeravatar
__blackjack__
User
Beiträge: 13079
Registriert: Samstag 2. Juni 2018, 10:21
Wohnort: 127.0.0.1
Kontaktdaten:

Und man kann auch gleich damit starten, also mit einem `offset` von 0. Das erste Ergebnis hat einen Schlüssel "next_offset" mit dem Wert 50. Wenn man das weiterverfolgt, kommt man am Ende anscheinend bei einem "next_offset": 0 an, das man als Abbruchkriterium nutzen kann.
„All religions are the same: religion is basically guilt, with different holidays.” — Cathy Ladman
Antworten