BeautifulSoup und Umlaute
Verfasst: Freitag 23. November 2012, 19:10
Ich versuche mit BeautifulSoup eine Webseite zu parsen. Diese ist, laut firefox, 'ISO-8859-2' encoded.
Leider wandelt BeautifulSoup in diesem Fall die Umlaute nicht automatisch um. Statt 'ü' wünsche ich mir eigentlich ein 'ü'.
Wenn ich das richtig sehe, funktioniert die Umwandlung bei der auskommentierten Seite.
Mir ist nicht ganz klar, wo jetzt genau der Unterschied liegt.
Leider wandelt BeautifulSoup in diesem Fall die Umlaute nicht automatisch um. Statt 'ü' wünsche ich mir eigentlich ein 'ü'.
Wenn ich das richtig sehe, funktioniert die Umwandlung bei der auskommentierten Seite.
Mir ist nicht ganz klar, wo jetzt genau der Unterschied liegt.
Code: Alles auswählen
from BeautifulSoup import BeautifulSoup
import requests
url = 'http://www.hydroinfo.hu/tables/dunhif_a.html'
#url = 'http://www.hydroinfo.hu/'
r = requests.get(url)
soup = BeautifulSoup(r.content)
table = soup.find('table')
for row in table.findAll('tr'):
cols = row.findAll('td')
print cols