Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Traceback (most recent call last):
File "parser.py", line 11, in <module>
print r
UnicodeEncodeError: 'ascii' codec can't encode character u'\xfc' in position 1207: ordinal not in range(128)
Ich glaube ich kann mir die Frage selber beantworten, wenn jemand Verbesserungen hat dann bitte her damit
Wenn ich BeautifulSoup richtig verstanden habe dann wird jeder string ("windows-1252") in unicode verwandelt und um unicode darstellen zu können im Terminal z.B., muss man den vorher wieder encodieren. Zumindest wenn Ziel- und Ursprungs-Codierung anders sind?
@peterle: Nicht das Ergebnis von `findAll()` ausgeben. `BeautifulSoup` hat da in irgendeiner `__repr__()`-Methode einen Fehler wo versucht wird Unicode ohne Kodierungsangabe in eine Zeichenkette umzuwandeln.
Eventuell könntest Du auch auf `lxml.html` umsteigen. `BeautifulSoup` wird AFAIK nicht mehr aktiv entwickelt. Einziger Vorteil ist, dass es nur ein Modul in reinem Python ist.