Die Suche ergab 5 Treffer

von philsc
Dienstag 1. Dezember 2020, 10:24
Forum: Allgemeine Fragen
Thema: Informationen von URL extrahieren, die nicht im Quellcode zu finden sind
Antworten: 8
Zugriffe: 803

Re: Informationen von URL extrahieren, die nicht im Quellcode zu finden sind

Okay das geht leider nicht so, wie ich es mir dachte. Wenn ich mit der Methode von Sirius3 scrape, dann habe ich nach wenigen Minuten einen IP-Bann bei Sofascore.
Mit Selenium habe ich es aber auch hinbekommen, jedoch funktioniert das nur auf meinem Desktop PC, nicht mit meinem Laptop. Hier der Code ...
von philsc
Montag 30. November 2020, 21:46
Forum: Allgemeine Fragen
Thema: Informationen von URL extrahieren, die nicht im Quellcode zu finden sind
Antworten: 8
Zugriffe: 803

Re: Informationen von URL extrahieren, die nicht im Quellcode zu finden sind

Sirius3 hat geschrieben: Montag 30. November 2020, 21:24 Die ganzen Daten kommen bequem per json: https://api.sofascore.com/api/v1/event/8896864/lineups
Die event-ID findet sich auf der Hauptseite in einem script-Tag mit der ID __NEXT_DATA__, auch json kodiert.
Danke, das hilft mir sehr. Ich werde mal schauen, wie weit ich damit komme. :)
von philsc
Montag 30. November 2020, 20:51
Forum: Allgemeine Fragen
Thema: Informationen von URL extrahieren, die nicht im Quellcode zu finden sind
Antworten: 8
Zugriffe: 803

Re: Informationen von URL extrahieren, die nicht im Quellcode zu finden sind

Selenium habe ich schon benutzt, aber das ich dachte man könnte es direkt nur mit der URL scrapen, so wie bei HTML mit Beautifulsoup. Also ohne dass der Browser geöffnet werden muss meine ich.
von philsc
Montag 30. November 2020, 20:41
Forum: Allgemeine Fragen
Thema: Informationen von URL extrahieren, die nicht im Quellcode zu finden sind
Antworten: 8
Zugriffe: 803

Re: Informationen von URL extrahieren, die nicht im Quellcode zu finden sind

Ja sowas bräuchte ich. Das mit dem Headless Browser finde ich nicht so gut.
Im Prinzip möchte ich das, was ich bei Rechtsklick-->Untersuchen an Informationen angezeigt bekomme, in einer Variabel mit Python speichern.
Per Hand geht das ja relativ einfach mit Rechtsklick-->Untersuchen-->Copy Element ...
von philsc
Montag 30. November 2020, 18:27
Forum: Allgemeine Fragen
Thema: Informationen von URL extrahieren, die nicht im Quellcode zu finden sind
Antworten: 8
Zugriffe: 803

Informationen von URL extrahieren, die nicht im Quellcode zu finden sind

Hallo,

ich bin noch relativ neu in Python, jedoch habe ich schon einiges rumprobiert.
Bisher habe ich vor allem Informationen von Webseiten mit Beautifulsoup extrahiert, was auch super klappt.
Allerdings möchte ich nun die Startaufstellungen von Fußballspielen extrahieren, die nicht im Quellcode zu ...