urllib code alternative

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
Benutzeravatar
kevind
User
Beiträge: 71
Registriert: Montag 22. Oktober 2012, 20:23
Wohnort: /dev/null

Servus,

ich spiel grad mit urllib rum und frage mich ob die Art wie ich es mache in Ordnung ist oder ob ihr bessere alternativen habt.
Speziell die verarbeitung des HTTPResponse Objekts.

Der Code liest einfach die News headlines einer Webseite aus:

Code: Alles auswählen

import urllib.request

arch = urllib.request.urlopen("http://archlinux.org", data=None)
for line in arch:
    line = line.decode()
    if line.find("View full article:") != -1:
        print(line[line.find("\">")+2:-5])


Danke schonmal!

Gruss, Kev
BlackJack

@kevind: Das `requests`-Modul hat eine schönere API als der Kram aus der Standardbibliothek.

Mal davon abgesehen, dass man statt ``if haystack.find(needle) != -1:`` besser ``if needle in haystack:`` schreibt, sollte man HTML mit einem ordentlichen Parser verarbeiten und nicht mit fehleranfälligen Zeichenkettenoperationen. Ich verwende beispielsweise `lxml.html`.
Antworten