Seite 1 von 1

getText ignoriert <br>

Verfasst: Sonntag 9. Mai 2021, 16:23
von Rotmilan
Hallo,

ich habe mit BeautifulSoup und select eine Webseite ausgelesen:
content1 = soup.select(ident1)
dann extrahiere ich den Text:
text = content1[0].getText()
Das alles funktioniert soweit gut, einziges Manko ist, dass alle <br> ohne Ersatz gelöscht werden. Das heißt, bei der Ausgabe in der Variable "text" hängen die Wörter da aneinander, wo eigentlich ein Zeilenumbruch sein sollte.
Und das schaut leider gar nicht gut aus :evil:

Gibt es einen Anderen Befehl oder ein attribut, mit dem man das steuern kann? Ich habe dazu leider nichts gefunden... :cry:

LG

Re: getText ignoriert <br>

Verfasst: Montag 10. Mai 2021, 10:57
von __blackjack__
@Rotmilan: `getText()` sollte nicht mehr verwendet werden, das heisst jetzt `get_text()`. Und das ist schon die richtige Methode. Schau mal in die Dokumentation.