Timeout-Fehler
Verfasst: Dienstag 18. September 2012, 18:47
Hi,
ich greife auf HTML-Seiten im Netz zu und hole mir von dort jeweils einen Wert.
Problem ist jetzt, dass nach geraumer Zeit, wo der Code wunderbar funktioniert hat, jetzt plötzlich Fehlermeldungen kommen. In der Konsole gibt es eine Reihe von Zeilen, die ausgespuckt werden, im Kern scheint aber die HTML-Seite nicht verarbeitbar zu sein:
Ich habe noch keinen Plan, wie ich den Fehler umschiffen kann. Ich habe das jetzt erst einmal mit try-except abgefangen.
Zum Verständnis:
* Kann es sein, dass mich die Website erfasst und geblockt hat? Ich habe im Intervall von 5 Sekunden 7 Seiten bei denen geparst. Das scheint mir erst einmal kein Traffic zu sein...
Hinweise nehme ich gerne an...
ich greife auf HTML-Seiten im Netz zu und hole mir von dort jeweils einen Wert.
Code: Alles auswählen
# ...
url = urllib.request.urlopen(url)
source = str(url.read())
url.close()
# ...
Code: Alles auswählen
raise ValueError("unknown url type: %s" % self.full_url)
ValueError: unknown url type: h
Zum Verständnis:
* Kann es sein, dass mich die Website erfasst und geblockt hat? Ich habe im Intervall von 5 Sekunden 7 Seiten bei denen geparst. Das scheint mir erst einmal kein Traffic zu sein...
Hinweise nehme ich gerne an...