jetzt verstehe ich mal wieder was überhaupt nicht. Ich lese einen Namen aus einer mit utf-8 codierten Seite heraus. Ich wandle die Zeichen um in iso-8859-1 und trage den umcodierten Namen in eine Liste ein. Vor dem Eintrag ist alles so, wie es sein soll.
Code: Alles auswählen
(print name:) TRENTEMØLLER
Code: Alles auswählen
(print liste:) ['TRENTEM\xd8LLER']
Hier der Code:
Code: Alles auswählen
#!/usr/bin/env python
# -*- coding: iso-8859-1 -*-
import urllib2
def change_coding(ttl):
try: unicode = ttl.decode("utf-8")
except: iso = ttl
try: iso = unicode.encode("iso-8859-1")
except: iso = ttl
return iso
liste = []
source = urllib2.urlopen("http://profile.myspace.com/index.cfm?fuseaction=user.viewprofile&friendID=80919512").read()
pos1 = source.find('"nametext"',14000)
pos2 = source.find('</span><br>',pos1)
name = change_coding(source[pos1+11:pos2].strip())
print name
liste.append(name)
print liste