Das deutsche Python-Forum

Hallo,

ich habe mit BeautifulSoup und select eine Webseite ausgelesen:

content1 = soup.select(ident1)

dann extrahiere ich den Text:

text = content1[0].getText()

Das alles funktioniert soweit gut, einziges Manko ist, dass alle <br> ohne Ersatz gelöscht werden. Das heißt, bei der Ausgabe in der Variable "text" hängen die Wörter da aneinander, wo eigentlich ein Zeilenumbruch sein sollte.
Und das schaut leider gar nicht gut aus

Gibt es einen Anderen Befehl oder ein attribut, mit dem man das steuern kann? Ich habe dazu leider nichts gefunden...

LG

@Rotmilan: `getText()` sollte nicht mehr verwendet werden, das heisst jetzt `get_text()`. Und das ist schon die richtige Methode. Schau mal in die Dokumentation.

Das deutsche Python-Forum

getText ignoriert <br>

getText ignoriert <br>

Re: getText ignoriert <br>