Ich danke allen die mir direkt/indirekt geholfen haben mein Problem zu lösen. Ich hab eine mit wetter24.de eine Homepage gefunden von der man ohne Probleme an die gewünschen Daten kommt.
EDIT: Nochmal eine Frage:
<td width="83" class="first">Windgeschw. Bft (km/h)</td>
<td width="54"><div class="wind"><div class="bft">1</div><div class="kmh">(2)</div></td>
Daraus möchte ich nur die (2) haben, wenn ich nun:
Code: Alles auswählen
url = urllib2.urlopen("http://www.wetter24.de/de/home/wetter/weltwetter/ortewetter.html?cityID=49X16528&tx_mgcityweatherstatic_pi1[cityIDuse]=49X16528")
soup = BeautifulSoup(url.read(), convertEntities = BeautifulSoup.HTML_ENTITIES)
temp = soup.find(text=re.compile("Windgeschw. Bft (km/h)")).findNext("td")
output = temp.contents[0].string.strip()
dann erscheint folgende Fehlermeldung bei mir:
Traceback (most recent call last):
File "C:***\wetter.py", line 18, in <module>
temp = soup.find(text=re.compile("Windgeschw. Bft (km/h)")).findNext("td")
AttributeError: 'NoneType' object has no attribute 'findNext'