Seite 1 von 1

Alle Inhalte einer Liste verändern

Verfasst: Freitag 12. September 2014, 09:06
von nfehren
Guten morgen,
ich habe mithilfe der module re und urllib aus einer Internetseite bestimmte Informationen gezogen und in einer Liste abgespeichert.
Jetzt steht aber natürlich bei jedem Listeneintrag z.B. <title>abc</title>.
wie kann ich einen bestimmten Teil bei allen einträgen verändern, dass z.B. nur noch "abc" vorhanden ist?

Vielen Dank und mit freundlichen Grüßen.

Re: Alle Inhalte einer Liste verändern

Verfasst: Freitag 12. September 2014, 09:16
von Hyperion
nfehren hat geschrieben:Guten morgen,
ich habe mithilfe der module re und urllib aus einer Internetseite bestimmte Informationen gezogen und in einer Liste abgespeichert.
Das ist schon mal kein gutes Vorgehen! Wieso nutzt Du keinen HTML-Parser dafür?
nfehren hat geschrieben: Jetzt steht aber natürlich bei jedem Listeneintrag z.B. <title>abc</title>.
wie kann ich einen bestimmten Teil bei allen einträgen verändern, dass z.B. nur noch "abc" vorhanden ist?
Zum einen ist es in Python oftmals eleganter, eine neue Liste mit den richtigen Inhalten aufzubauen, zum anderen siehe meine erste Antwort - damit hättest Du dieses Problem nämlich gar nicht :-)

Re: Alle Inhalte einer Liste verändern

Verfasst: Freitag 12. September 2014, 09:19
von BlackJack
@nfehren: Wieso steht das „natürlich” da so drin? Man hätte ja auch gleich nur 'abc' selektieren können.

Die schlechte Lösung wäre dann wohl die bereits schlechten Lösung konsequent weiterzuführen, Du musst halt ganz offensichtlich eine Schleife über die Elemente der Liste schreiben und bei jedem die Tags entfernen und das Ergebnis in eine neue Liste stecken.

Die gute Lösung wäre es vernünftige Bibliotheken zu verwenden die das ganze nicht nur einfacher sondern insbesondere auch robuster machen. Also zum Beispiel `requests` und BeautifulSoup statt `urllib` und `re`.