Web Scrapping Cookies
Verfasst: Freitag 10. April 2020, 17:35
Moin Python Freunde,
ich habe folgendes Problem. Mein Script funktioniert soweit, das ich die Daten meines Fussballmanagaers jeden Tag auslesen kann und per CSV Speichere. Nun will ich aber, dass ich nicht händisch meine Cookies eintrage sondern ich möchte, dass das automatisch passiert. Bitte nehmt Rücksicht auf meinen schlechten Code. Dieses Projekt ist mein erstes Python Projekt.
Cookie hier extra anonymisiert
Dieser Teil funktioniert also einwandfrei wenn ich es hardcoded reinkopiere.
Hier nun dann versuche Cookies wegzulassen und automatisch zu holen, aber daran scheitere ich leider gnadenlos.
Wäre schön wenn mich hier jemand unterstützen könnte.
Grüße
Boon
ich habe folgendes Problem. Mein Script funktioniert soweit, das ich die Daten meines Fussballmanagaers jeden Tag auslesen kann und per CSV Speichere. Nun will ich aber, dass ich nicht händisch meine Cookies eintrage sondern ich möchte, dass das automatisch passiert. Bitte nehmt Rücksicht auf meinen schlechten Code. Dieses Projekt ist mein erstes Python Projekt.
Cookie hier extra anonymisiert
Code: Alles auswählen
import requests
headers_player = {
'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.130 Safari/537.36',
'Accept' : 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,/;q=0.8',
'Accept-Language' : 'de,en-US;q=0.7,en;q=0.3',
'Connection' : 'keep-alive',
'Cookie' : '_ga=abc; _fbp=cde; _gid=fgh; onlineliga_location=OL-cookie; io=io-coockie; XSRF-TOKEN=xsrf-token; onlineliga_session=OL-Session',
'Accept-Encoding' : 'gzip, deflate, br',
'Host' : 'www.onlineliga.de',
'Upgrade-Insecure-Requests' : "1"
}
rplayer = requests.get(url = playerurl , headers = headers_player)
Hier nun dann versuche Cookies wegzulassen und automatisch zu holen, aber daran scheitere ich leider gnadenlos.
Code: Alles auswählen
headers_player = {
'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.130 Safari/537.36',
'Accept' : 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,/;q=0.8',
'Accept-Language' : 'de,en-US;q=0.7,en;q=0.3',
'Connection' : 'keep-alive',
'Accept-Encoding' : 'gzip, deflate, br',
'Host' : 'www.onlineliga.de',
'Upgrade-Insecure-Requests' : "1"
}
r = requests.get('https://www.onlineliga.de')
c = r.cookies
h = r.headers
print (r.headers)
# session = requests.Session()
# response = session.get('https://www.onlineliga.de')
# cookies = session.cookies
# cookies = response.cookies.get_dict('.onlineliga.de')
# if cookies:
# str_cook = str(cookies)
# str_cook = re.sub('{', '', str_cook)
# str_cook = re.sub('}', '', str_cook)
# str_cook = re.sub(':', '=', str_cook)
## str_cook = re.sub("'", '', str_cook)
## str_cook = re.sub(",", ';', str_cook)
# print(str_cook)
#print(cookies)
# print("------------------------------------")
# #headers_player.update({'Cookie' : cookies})
# #headers_skill.update({'Cookie' : cookies})
# print("PLAYER")
# print(headers_player)
# print("------------------------------------")
# print("SKILL")
# print(headers_skill)
for x in playerids:
playerurl = "https://www.onlineliga.de/player/overview?playerId=" + x
rplayer = requests.get(url = playerurl , cookies = c, headers = headers_player)
Wäre schön wenn mich hier jemand unterstützen könnte.
Grüße
Boon