Die Suche ergab 4 Treffer

von RC_data
Montag 2. Februar 2015, 18:09
Forum: Allgemeine Fragen
Thema: BeautifulSoup - Deutsche Buchstaben im html code
Antworten: 6
Zugriffe: 1332

Re: BeautifulSoup - Deutsche Buchstaben im html code

So. Ich denke ich kann den Fall jetzt nochmal klarer beschreiben, so dass klar wird wo die Lücke zur Hilfe besteht. Hier ein Snippet

#-*- coding: iso-8859-1 -*-
import urllib
import mechanize
from bs4 import BeautifulSoup
import re
import codecs
import unicodedata

from bs4 import ...
von RC_data
Montag 2. Februar 2015, 13:41
Forum: Allgemeine Fragen
Thema: BeautifulSoup - Deutsche Buchstaben im html code
Antworten: 6
Zugriffe: 1332

Re: BeautifulSoup - Deutsche Buchstaben im html code

Aha. Ich verwende sublime text zur Anzeige. Hoffe ich habe geschnallt was du gemeint hast.
von RC_data
Montag 2. Februar 2015, 13:19
Forum: Allgemeine Fragen
Thema: BeautifulSoup - Deutsche Buchstaben im html code
Antworten: 6
Zugriffe: 1332

Re: BeautifulSoup - Deutsche Buchstaben im html code

Vielen Dank für die Antowort. Ich werde mir die Lektüren mal zugemüte führen.

hierzu Deiner Antwort:

1. der HTML-Code enthält noch umlaute. Für die Anzeige (print htmltext) werden die Zeichen umgewandelt.
2. Der spätere Zweck ist die gefilterten Textinformation als Suchstichwörter zu verwenden ...
von RC_data
Montag 2. Februar 2015, 12:06
Forum: Allgemeine Fragen
Thema: BeautifulSoup - Deutsche Buchstaben im html code
Antworten: 6
Zugriffe: 1332

BeautifulSoup - Deutsche Buchstaben im html code

Guten Tag zusammen,

ich habe arbeite gerade an einem Projekt bei dem ich mir einen HTML-Code mit beautiful soup ziehe.

In dem HTML-Code werden Deutsche Umlaute (z.B. wie in Bär, oder für) als ü oder andere Zeichenfolgen wieder gegeben.

Da ich in dem HTML-Code aber nach Worten suche die Umlaute ...