mir fehlt gerade der Ansatzpunkt, weil ich auch keinen wirklichen Begriff habe um das Problem zu beschreiben.
Ich lese mit BeautifulSoup html-Code ein
Suche mir dann den per CSS den Teil, den ich haben möchtesoup = BeautifulSoup(string_aus_datei, 'html.parser')
Bekomme aber dann Umlaute nicht richtig übergeben.content1 = soup.select(css_ident)
Konkret:
In der Webseite steht „...Hück...“ und in der
Ausgabe von content1 bekomme ich „...H\xc3\xbcck...“
Wo muss ich da ansetzen? liegt das am parser, oder fehlt mir noch ein attribut? Ich habe keine Ahnung...