Seite 1 von 1

Umgang mit Sonderzeichen

Verfasst: Donnerstag 15. September 2011, 23:41
von Pascal
Hallo,

Ich stehe vor dem Problem, das ich einen Text mit Sonderzeichen (ä, ü, ö, ß) verarbeiten will.

Code: Alles auswählen

>>> d = urllib.urlopen('http://paste.pocoo.org/raw/476717/')
>>> 
>>> print d.read()
Die Künstliche Intelligenz (KI) ist ein großes Teilgebiet der Informatik mit starken Einflüssen aus Logik, Linguistik, Neurophysiologie und Kognitionspsychologie. Dabei unterscheidet sich die KI in der Methodik zum Teil erheblich von der klassischen Informatik. Statt eine vollständige Lösungsbeschreibung vorzugeben, wird in der Künstlichen Intelligenz die Lösungsfindung dem Computer selbst überlassen. Ihre Verfahren finden Anwendung in Expertensystemen, in der Sensorik und Robotik.
Im Verständnis des Begriffs „Künstliche Intelligenz“ spiegelt sich oft die aus der Aufklärung stammende Vorstellung vom Menschen als Maschine wider, dessen Nachahmung sich die so genannte „starke KI“ zum Ziel setzt: eine Intelligenz zu erschaffen, die wie der Mensch nachdenken und Probleme lösen kann und die sich durch eine Form von Bewusstsein beziehungsweise Selbstbewusstsein sowie Emotionen auszeichnet.
>>> 

Was muss ich machen, damit in meinem Text wieder ä, ü, ö und ß stehen?

Re: Umgang mit Sonderzeichen

Verfasst: Donnerstag 15. September 2011, 23:49
von cofi
Nun Bytes wollen dekodiert werden:

Code: Alles auswählen

In [3]: urllib.urlopen('http://paste.pocoo.org/raw/476717/').read().decode('utf-8')
Out[3]: u'Die K\xfcnstliche Intelligenz (KI) ist ein gro\xdfes Teilgebiet der Informatik mit starken Einfl\xfcssen aus Logik, Linguistik, Neurophysiologie und Kognitionspsychologie. Dabei unterscheidet sich die KI in der Methodik zum Teil erheblich von der klassischen Informatik. Statt eine vollst\xe4ndige L\xf6sungsbeschreibung vorzugeben, wird in der K\xfcnstlichen Intelligenz die L\xf6sungsfindung dem Computer selbst \xfcberlassen. Ihre Verfahren finden Anwendung in Expertensystemen, in der Sensorik und Robotik.\nIm Verst\xe4ndnis des Begriffs \u201eK\xfcnstliche Intelligenz\u201c spiegelt sich oft die aus der Aufkl\xe4rung stammende Vorstellung vom Menschen als Maschine wider, dessen Nachahmung sich die so genannte \u201estarke KI\u201c zum Ziel setzt: eine Intelligenz zu erschaffen, die wie der Mensch nachdenken und Probleme l\xf6sen kann und die sich durch eine Form von Bewusstsein beziehungsweise Selbstbewusstsein sowie Emotionen auszeichnet.'

In [4]: print _
------> print(_)
Die Künstliche Intelligenz (KI) ist ein großes Teilgebiet der Informatik mit starken Einflüssen aus Logik, Linguistik, Neurophysiologie und Kognitionspsychologie. Dabei unterscheidet sich die KI in der Methodik zum Teil erheblich von der klassischen Informatik. Statt eine vollständige Lösungsbeschreibung vorzugeben, wird in der Künstlichen Intelligenz die Lösungsfindung dem Computer selbst überlassen. Ihre Verfahren finden Anwendung in Expertensystemen, in der Sensorik und Robotik.
Im Verständnis des Begriffs „Künstliche Intelligenz“ spiegelt sich oft die aus der Aufklärung stammende Vorstellung vom Menschen als Maschine wider, dessen Nachahmung sich die so genannte „starke KI“ zum Ziel setzt: eine Intelligenz zu erschaffen, die wie der Mensch nachdenken und Probleme lösen kann und die sich durch eine Form von Bewusstsein beziehungsweise Selbstbewusstsein sowie Emotionen auszeichnet.

Re: Umgang mit Sonderzeichen

Verfasst: Freitag 16. September 2011, 07:59
von jens
Du musst halt schauen in welchem Encoding die Seite ist und dann nach unicode wandeln. Wie das gehen kann, kannst du hier sehen: https://github.com/jedie/django-tools/b ... #L260-L307

Re: Umgang mit Sonderzeichen

Verfasst: Samstag 17. September 2011, 23:15
von Pascal
Vielen Dank :D Es klappt