Die Suche ergab 5 Treffer

von DanielAC
Donnerstag 12. November 2020, 16:06
Forum: Allgemeine Fragen
Thema: Browser steuern mit Python
Antworten: 1
Zugriffe: 801

Browser steuern mit Python

Hallo zusammen,

ich würde gerne eine mit Python aufgerufene Webseite speichern. Als Browser nutze ich Firefox (bzw. Tor). Wenn die Seite aufgerufen ist, kann ich Strg + s drücken und bekomme dann das Fenster um die Seite zu speichern.
Das soll aber automatisch passieren (also Strg + s, dann Enter ...
von DanielAC
Mittwoch 11. November 2020, 11:13
Forum: Allgemeine Fragen
Thema: Download von Webseiten
Antworten: 7
Zugriffe: 745

Re: Download von Webseiten

Eine interessante Möglichkeit ist offenbar Pywebcopy mit der Funktion save_website.
Das klappt prinzipiell. Er lädt tatsächlich die benötigten Informationen herunter. Leider scheint die Funktion aber irgendwo zu hängen, denn nach dem Download (zumindest nach dem Download von den von mir benötigten ...
von DanielAC
Mittwoch 11. November 2020, 10:29
Forum: Allgemeine Fragen
Thema: Download von Webseiten
Antworten: 7
Zugriffe: 745

Re: Download von Webseiten

Das ist leider alles ein wenig ernüchternd.
Die Steuerung mit Selenium ist zwar ganz praktisch, aber letztendlich ein wenig zu langsam, wenn ich das nicht nur für einige Seiten machen möchte...

Wie kann ich denn erkennen, welche Inhalte dynamisch nachgeladen werden?
von DanielAC
Dienstag 10. November 2020, 18:36
Forum: Allgemeine Fragen
Thema: Download von Webseiten
Antworten: 7
Zugriffe: 745

Re: Download von Webseiten

Und wie löse ich das Problem mit JS? Ich kenne mich damit leider gar nicht aus und bin in Python auch nicht gerade ein Experte...
von DanielAC
Dienstag 10. November 2020, 16:55
Forum: Allgemeine Fragen
Thema: Download von Webseiten
Antworten: 7
Zugriffe: 745

Download von Webseiten

Hallo zusammen,

wenn ich Webseiten herunterladen möchte, sehe ich in der gespeicherten Datei manchmal nicht alle Links, die auf der eigentlichen Seite vorhanden sind.

Beispiel ist https://www.adac.de/rund-ums-fahrzeug/autokatalog/marken-modelle/abarth/124-spider

Mein Code sieht so aus:

url ...