Ich beginne mich gerade mit BeautifulSoup auseinanderzusetzen und scheitere früh
Code: Alles auswählen
import urllib2
from BeautifulSoup import BeautifulSoup
def getWikiPage(url):
headers = {
'User-Agent':
'Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv:1.8.1.3) Gecko/20070309 Firefox/2.0.0.3',
'Accept-Encoding': 'deflate',
'Accept-Charset': 'utf-8',
'Referer': 'http://de.wikipedia.org/wiki/Hauptseite',
}
try:
request = urllib2.Request(url, None, headers)
response = urllib2.urlopen(request)
content = response.read()
response.close()
return content
except urllib2.HTTPError:
print "HTTPError: %s" % url
page = getWikiPage("http://de.wikipedia.org/wiki/Kategorie:!Hauptkategorie")
soup = BeautifulSoup(page)
print type(soup)
tabellenkopf = soup.find('div','mw-subcategories')
print type(tabellenkopf)
span = tabellenkopf.findAll('span')
Was genau läuft schief bei der Sache?span = tabellenkopf.findAll('span')
AttributeError: 'NoneType' object has no attribute 'findAll'