Hallo,
ich habe schon ein paar mal mittels Beautiful Soup Webseiten geparst.
Nun möchte ich mich auf der Seite
http://www.magickartenmarkt.de/index.php
einloggen und ein paar Informationen auslesen.
Mit Beautiful Soup kann ich mich soweit ich weiß nicht einloggen. Oder?
Mit mechanize kann ich mich einloggen, aber den nicht das HTML parsen. Richtig?
Zunächst habe ich versucht, mich einzuloggen (mechanize). Ob das Einloggen erforlgreich war, könnte ich z.B. überprüfen, wenn ich schaue, ob im Seitentext der Hinweis "Du hast ein falsches Passwort eingegeben." steht. Aber ich wüsste nicht, wie das mit mechanize geht.
(Ich bin lernwilliger Laie. Also bitte beim Antorten langsam sprechen... )
Gruß
Jochen
mechanize und/oder Beautiful Soup
-
- Python-Forum Veteran
- Beiträge: 16025
- Registriert: Freitag 20. Juni 2003, 16:30
- Kontaktdaten:
Naja, du kannst dir ja mit Mechanize den Code ausgeben lassen und den mit html5lib, lxml.html oder BeautifulSoup scrapen. Die Module schließen sich ja nicht gegenseitig aus.
My god, it's full of CARs! | Leonidasvoice vs (former) Modvoice
Leider ist mir das noch nicht gelungen. Wenn ich mittelsLeonidas hat geschrieben:Naja, du kannst dir ja mit Mechanize den Code ausgeben lassen und den mit html5lib, lxml.html oder BeautifulSoup scrapen. Die Module schließen sich ja nicht gegenseitig aus.
Code: Alles auswählen
br = mechanize.Browser()
br.open('http://www.magickartenmarkt.de/index.php')
Code: Alles auswählen
soup = BeautifulSoup(br
Jetzt habe ich es.
Das funktioniert, ohne dass ich verstehe, was das response macht. Kannst Du mir das erklären?
Code: Alles auswählen
br.open('http://www.magickartenmarkt.de/index.php'')
source=br.response()
soup = BeautifulSoup(source)