getText ignoriert <br>
Verfasst: Sonntag 9. Mai 2021, 16:23
Hallo,
ich habe mit BeautifulSoup und select eine Webseite ausgelesen:
Und das schaut leider gar nicht gut aus
Gibt es einen Anderen Befehl oder ein attribut, mit dem man das steuern kann? Ich habe dazu leider nichts gefunden...
LG
ich habe mit BeautifulSoup und select eine Webseite ausgelesen:
dann extrahiere ich den Text:content1 = soup.select(ident1)
Das alles funktioniert soweit gut, einziges Manko ist, dass alle <br> ohne Ersatz gelöscht werden. Das heißt, bei der Ausgabe in der Variable "text" hängen die Wörter da aneinander, wo eigentlich ein Zeilenumbruch sein sollte.text = content1[0].getText()
Und das schaut leider gar nicht gut aus
Gibt es einen Anderen Befehl oder ein attribut, mit dem man das steuern kann? Ich habe dazu leider nichts gefunden...
LG