ich bin momentan dabei ein Tool zu schreiben das meine Serien überarbeitet in dem es den Datei Namen ändert.
Dafür benötige die Inhalt einer Website leider habe ich da Probleme mit der String Codierung.
Den Inhalt der Website lade ich momentan mit folgenden Zeilen runter.
Code: Alles auswählen
import urllib.request
def getNewSerie(url):
Serien = {}
httpSite = urllib.request.urlopen(url)
content = str(httpSite.read())
httpSite.close()
Im Quelltext der Internet Seite steht "charset=iso-8859-1".
Deswegen habe ich das print duch
Code: Alles auswählen
sys.stdout.buffer.write(out.encode('latin_1'))
Jetzt weiß ich leider nicht mehr weiter wie ich das Problem lösen kann. Auch in der docu steht leider nichts drin.
Hatte gedacht das man " urllib.request" sagen könnte welches encodeing benutz werden soll.
Welche Möglichkeiten hätte ich sonst noch das Problem mit den Umlauten zu lösen ohne per Hand suchen und ersetzten in allen Strings zu machen ?
Freue mich über jede Hilfe.
Gruß
Ignis-Draco