ich bastel grad an meinem 1.ten Crawler.
Nun wollte ich, bis mein Crawler alles richtig ausgibt, eine Seite "index.html" als offline Testobjekt dafür hernehmen um nicht bei jedem Versuch eine Anfrage an den Host zu schicken.
Leider beschwert sich requests (eigentlich auch klar).. das es keine Internetseite ist.
Gibt es da einen Trick die *.html auf der HD abzufragen?
Code: Alles auswählen
import requests
from bs4 import BeautifulSoup
url = ".index.html"
r = requests.get(url)
doc = BeautifulSoup(r.text, "html.parser")
Grüße,