ich verwende seit einiger Zeit beautiful soup um einige Infos aus dem Netz zu holen. Bisher hatte ich keine Probleme und bin mit der Verwendung gut klar gekommen. Seit einigen Tagen funktioniert aber einiges nicht mehr, ich vermute das die Website geändert wurde und ich weiß nicht, wie ich das Problem weiter eingrenzen kann:
Code: Alles auswählen
import mechanize, bs4
browser=mechanize.Browser()
browser.open('http://www.comdirect.de/inf/indizes/detail/chart.html?TIME_SPAN=1D&ID_NOTATION=20735')
test=browser.response().read()
soup = bs4.BeautifulSoup(test)
Code: Alles auswählen
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/usr/lib64/python2.7/site-packages/bs4/__init__.py", line 172, in __init__
self._feed()
File "/usr/lib64/python2.7/site-packages/bs4/__init__.py", line 185, in _feed
self.builder.feed(self.markup)
File "/usr/lib64/python2.7/site-packages/bs4/builder/_lxml.py", line 195, in feed
self.parser.close()
File "parser.pxi", line 1187, in lxml.etree._FeedParser.close (src/lxml/lxml.etree.c:87912)
File "parsertarget.pxi", line 130, in lxml.etree._TargetParserContext._handleParseResult (src/lxml/lxml.etree.c:97055)
File "lxml.etree.pyx", line 294, in lxml.etree._ExceptionContext._raise_if_stored (src/lxml/lxml.etree.c:8862)
File "saxparser.pxi", line 259, in lxml.etree._handleSaxData (src/lxml/lxml.etree.c:93200)
UnicodeDecodeError: 'utf8' codec can't decode byte 0xfe in position 51: invalid start byte
Edit: Das Ganze ist Python 2.7.3 unter Linux.
Grüße Basti