Webscraping - Requestzeiten verkürzen, JavaScript lädt nach
Verfasst: Mittwoch 19. Januar 2022, 01:10
Hallo zusammen,
ich scrape mittels der Requests-Libary und BS4 eine Website nach Informationen und wundere mich bereits seit einigen Tag über relativ üppig Dealys bis ich die nächste Response erhalte. Habe nun beim manuellen Besuch der Website entdeckt, dass ein Feld auf der Website über JavaScripte nachgeladen wird und dies den SiteLoad extrem in die Länge zieht. Die Daten die ich benötige sind aber weitaus eher ausgeladen ..
Gibt es eine Möglichkeit den Request zu "unterbrechen" sobald die benötigten Daten vollständig geladen sind, oder bestimmte Teile der Website generell nicht ausladen zu lassen? Ich befürchte zwar fast dass dieses Unterfangen schwierig wird, aber würde mich dennoch sehr über Input freuen!
Grüße,
Nico
ich scrape mittels der Requests-Libary und BS4 eine Website nach Informationen und wundere mich bereits seit einigen Tag über relativ üppig Dealys bis ich die nächste Response erhalte. Habe nun beim manuellen Besuch der Website entdeckt, dass ein Feld auf der Website über JavaScripte nachgeladen wird und dies den SiteLoad extrem in die Länge zieht. Die Daten die ich benötige sind aber weitaus eher ausgeladen ..
Gibt es eine Möglichkeit den Request zu "unterbrechen" sobald die benötigten Daten vollständig geladen sind, oder bestimmte Teile der Website generell nicht ausladen zu lassen? Ich befürchte zwar fast dass dieses Unterfangen schwierig wird, aber würde mich dennoch sehr über Input freuen!
Grüße,
Nico