encoding problem

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
roakin
User
Beiträge: 26
Registriert: Montag 30. April 2007, 09:31

ich parse mit beautiful soup verschiedene webseiten. bei deutschen webseiten habe ich allerdings probleme mit den sonderzeichen und die Ausgabe schaut dann beispielsweise so aus:

Großglockner: Aktivwoche für Singles

gibt es da eine möglichkeit die ausgabe korrekt darszustellen? ich hab mal

# -*- coding: utf-8 -*-

angegeben, aber das hilft leider auch nit
Benutzeravatar
birkenfeld
Python-Forum Veteran
Beiträge: 1603
Registriert: Montag 20. März 2006, 15:29
Wohnort: Die aufstrebende Universitätsstadt bei München

Die Ausgabe ist schon UTF-8, das Problem ist wohl eher, dass den Ausgabemedium (Terminal?) dieses nicht erkennt bzw. eingestellt hat.
Dann lieber noch Vim 7 als Windows 7.

http://pythonic.pocoo.org/
roakin
User
Beiträge: 26
Registriert: Montag 30. April 2007, 09:31

ich progse mit eclipse ... dh ich muss einen weg finden eclipse zu sagen die consolenausgabe soll utf-8encoded sein oder?
joost
gelöscht
Beiträge: 134
Registriert: Sonntag 29. April 2007, 13:28

Tja .... die Eclipse-Hilfe verweist da u.a auf den Java-Quellcode.

Man kann in Windows->Preferences->General->Workspaces das Encoding für die Text-Editoren des Source-Codes einstellen, voreingestellt ist 'cp1252' und ich habe es erst einmal dabei belassen, utf-8 steht aber auch zur Auswahl.

Mein Konsolenfenster hat Umlaute bisher klaglos mitgemacht. Ob obige Einstellungen dieses Fenster miteinstellen, kann ich auf einen ersten Blick auf die Sache nicht erkennen. Die Hilfe verweist übrigens auch auf Änderungen am Java-Quellcode von Class ResourcesPlugin (Java).
[color=green][size=75]Never use idle.pyw, if you need sys.stdin[/size][/color]
Antworten