verzweifel mal wieder an den bösen Encodings.
Ziel: von zwei unterschiedlichen Web Ressourcen ziehe ich Texte, diese will ich miteinander vergleichen.
Code: Alles auswählen
# -*- coding: utf-8 -*-
.....
html=response.read()
imdbTitle=findNamesInHtml(html)
imdbTitle=imdbTitle[0].decode("utf8")
....
html=response.read()
listE=findNamesInHtml(html)
name=listE[0].decode("utf8")
....
#Vergleich der beiden
if name.strip().upper().startswith(imdbTitle.strip().upper()):
......
* * Found Movie: Der Herr der Ringe - Die Gefährten seems not be correct for: Der Herr der Ringe - Die Gefährten
Wie bekomme ich denn hier die bösen Umlaut in gleicher Art und Weise kodiert?
Danke schon mal
Dom