Python beim scrapen bekomme ich IndexError: listindex out of range

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
Pytronik
User
Beiträge: 2
Registriert: Donnerstag 30. Januar 2020, 00:32

N'abend

Ich probiere gerade von https://registrierung.gmx.net/ bestimmte werte zu scrapen. Ich möchte nun den src wert scrapen.
So sieht mein Skript aus

Code: Alles auswählen

import lxml.html
import requests

url = 'https://registrierung.gmx.net/'

scraper = requests.get(url)

site = lxml.html.fromstring(scraper.text)
src = site.xpath('//*[@id="captchaImage"]')[0].get('src')
Doch ich bekomme immer nur einen Error

Code: Alles auswählen

File "c:/Users/Cornelius/Desktop/raffle/test1.py", line 10, in <module>
    src = site.xpath('//*[@id="captchaImage"]')[0].get('src')
IndexError: list index out of range
Ich probiere das ganze seit ca. 2 Stunden, finde aber keine Lösung. Ich weiß, dass es mit Selenium möglich wäre, aber es muss doch eine andere Lösung geben.
Schönen Abend noch!
Benutzeravatar
__blackjack__
User
Beiträge: 14052
Registriert: Samstag 2. Juni 2018, 10:21
Wohnort: 127.0.0.1
Kontaktdaten:

@Pytronik: Es gibt halt kein Element mit der id "captchaImage". Schau Dir das HTML was Du da bekommst einfach mal an. Das besteht im Grunde nur aus <script>-Tags, der Rest wird dann erst nachgeladen.
“Vir, intelligence has nothing to do with politics!” — Londo Mollari
Antworten