Hallo, ich bin ziemlich neu in Python, möchte aber arbeitsbedingt eine Website auslesen. Ich möchte auf folgender Seite (
http://www.sciencedirect.com/science/journal/0304405X) mir die Autoren, die Titel, und die Seitenanzahlen ausgeben lassen der einzelnen Research-Paper. Ich möchte mit den Autoren anfangen, komme aber nicht weiter
. Es wird nichts ausgegeben. Der HTML Quelltext ist recht umfangreich, ich habe ihn mir angeguckt und analysiert. Die Autorennamen sind in einer Liste, <li> mit der Klasse "authors ". Zusätzlich ist um die <ul> Umgebung eine geordnete Liste <ol>.
Code: Alles auswählen
import requests
from bs4 import BeautifulSoup
r = requests.get("http://www.sciencedirect.com/science/journal/0304405X")
soup = BeautifulSoup(r.content, 'lxml')
for oltag in soup.find_all('ol', {'class': 'articleList results'}):
for ultag in soup.find_all('ul', {'class': 'article'}):
for litag in ultag.find_all('li', {'class': 'authors '}):
Könnt ihr mir helfen? Vielen Dank