MyEbay - crawler/scraping
Verfasst: Dienstag 16. Juni 2020, 09:24
Hallo Leute,
ich stell mich mal eben kurz vor. Ich bin 28 Jahre alt und gerade fertig mit meinem M.Sc Mechatronik. Seit kurzem befasse ich mich mit Python und DataScience, Neuronale Netze, Machinen Learning etc.
Für einen Kumpel soll ich nun folgendes realisieren.
Er möchte in seinem eigenen Ebay-Account die Daten von seinen Verkäufen haben. Anschrift, Preis des Produktes, Datum und alles was so möglich ist und was er möchte.
Ich bin super frisch im crawler/scraping. Naja generell in der kompletten Sprache Python. Ich arbeite erstmal mit JupyterNotebook. Ich schaffe es eine beliebe öffentliche Anzeige auf Ebay anzusteuern und dort den Preis zu extrahieren. Nun möchte ich das selbe mit den Verkäufen machen. Dazu muss man ja eine Website zu crawlen die hinter einem LogIn steht. Ich bekomme sobald ich die URL von meinem MyEbay ansteuern möchte den Fehler 405. Denke, dass ist weil ich die Seite nicht ohne Authentisierung crawlen darf.
Aktuell ist mein Code um eine öffentliche Anzeige zu crawlen sehr übersichtlich:
import requests
from bs4 import BeautifulSoup
r = requests.get("https://www.ebay.de/itm/RAMPS-1-6-Plus-Shield-f") // Habe die URL mal abgekürzt
print(r)
antwort: Response 200 // also die Seite kann aufgerufen und gecrawlt werden. Was auch soweit funktioniert.
Wie sieht das nun mit einer Seite hinter einem Login aus? Im Internet sind viele Ansätze die ich aber nicht nachvollziehen kann.
Ich muss erst die LogIn-Seite anfragen und dort den Benutzername und Passwort per push() Befehl einfügen. Anschließend wäre es ja möglich die dahinterliegende Seite aufzurufen oder?
Ich hoffe ich konnte mein Problem erklären. Bitte den Thread verschieben falls es ein spezielles Forum dafür gibt!! Danke
ich stell mich mal eben kurz vor. Ich bin 28 Jahre alt und gerade fertig mit meinem M.Sc Mechatronik. Seit kurzem befasse ich mich mit Python und DataScience, Neuronale Netze, Machinen Learning etc.
Für einen Kumpel soll ich nun folgendes realisieren.
Er möchte in seinem eigenen Ebay-Account die Daten von seinen Verkäufen haben. Anschrift, Preis des Produktes, Datum und alles was so möglich ist und was er möchte.
Ich bin super frisch im crawler/scraping. Naja generell in der kompletten Sprache Python. Ich arbeite erstmal mit JupyterNotebook. Ich schaffe es eine beliebe öffentliche Anzeige auf Ebay anzusteuern und dort den Preis zu extrahieren. Nun möchte ich das selbe mit den Verkäufen machen. Dazu muss man ja eine Website zu crawlen die hinter einem LogIn steht. Ich bekomme sobald ich die URL von meinem MyEbay ansteuern möchte den Fehler 405. Denke, dass ist weil ich die Seite nicht ohne Authentisierung crawlen darf.
Aktuell ist mein Code um eine öffentliche Anzeige zu crawlen sehr übersichtlich:
import requests
from bs4 import BeautifulSoup
r = requests.get("https://www.ebay.de/itm/RAMPS-1-6-Plus-Shield-f") // Habe die URL mal abgekürzt
print(r)
antwort: Response 200 // also die Seite kann aufgerufen und gecrawlt werden. Was auch soweit funktioniert.
Wie sieht das nun mit einer Seite hinter einem Login aus? Im Internet sind viele Ansätze die ich aber nicht nachvollziehen kann.
Ich muss erst die LogIn-Seite anfragen und dort den Benutzername und Passwort per push() Befehl einfügen. Anschließend wäre es ja möglich die dahinterliegende Seite aufzurufen oder?
Ich hoffe ich konnte mein Problem erklären. Bitte den Thread verschieben falls es ein spezielles Forum dafür gibt!! Danke