Ich hab ein Problem mit einer Website auslesen mit Python. Um Websites auszulesen hab ich schon verschiedenes versucht (Java, LibreOffice), aber irgendwie war das doch alles recht umständlich, deswegen hab ich mich ein bisschen mit Python beschäftigt, welches in Verbindung mit BeautifulSoap ja gut funktionieren soll.
Nun hab ich aber das Problem, dass wenn ich die Website einlese, der Teil den ich benötige nicht in der Form eingelesen wird, wie es z.B. im Firefox Inspector angezeigt wird. Der Quelltext wird aber anderst angezeigt.
Ich will von dieser Seite die Ergebnisse der letzen Jahre der NFL Partien auslesen. http://www.flashscore.de/football/usa/n ... rgebnisse/
Ich hab schon mehrere Ansätze versucht. Kurze Frage vorweg: Python 2 oder 3? Wenn ich BeautifulSoap per pip install installier, hat er es nur für Python 2 installiert, wie bekomme ich das verfügbar für Python 3?
Code: Alles auswählen
import urllib2
opener = urllib2.build_opener()
opener.addheaders = [('User-agent', 'Mozilla/5.0')]
url = "http://www.flashscore.de/football/usa/nfl-2015-2016/ergebnisse/"
response = opener.open(url)
page = response.read()
from BeautifulSoup import BeautifulSoup
soup = BeautifulSoup(page)
Code: Alles auswählen
print(soup.prettify())
Genau das selbe bekomme ich auch, wenn ich mir von der Seite den Quelltext anzeigen lasse. Wenn ich jedoch das Element im Inspector untersuche, bekomme ich ein Format, was auch auslesbar ist. Liegt das an der Seite, dass das nicht geht, oder kann man das Problem irgendwie mit Python lösen? Dass ich die einzelnen Partien mit den Ergebnissen auslesen kann und weiterverwerten kann?... CC÷0¬~AA÷6c1AcEX4¬AD÷1451871000¬AB÷3¬CR÷3¬AC÷3¬CX÷Green Bay Packers¬ER÷17. Spieltag¬AX÷0¬AV÷1451885987|¬BX÷-1¬WM÷GBP¬AE÷Green Bay Packers¬WU÷green-bay-packers¬ ...
schonmal lieben Dank für die Antworten
viele Grüße
Wirman