Seite 1 von 1
urllib gibt immer nur die Seiten in html Format aus
Verfasst: Donnerstag 6. Juni 2019, 15:18
von egon11
Hallo, ich bin gerade dabei, etwas mit urllib zu schreiben. Wenn ich
die Seite öffne bzw mir anzeigen möchte, kommt das immer in html Format.
Gibt es eine kurze Lösung, dass die Seite, oder zumindest der Text so ausgegeben wird, wie es auf der URL- Seite steht?
Re: urllib gibt immer nur die Seiten in html Format aus
Verfasst: Donnerstag 6. Juni 2019, 15:19
von Sirius3
Die Seite wird so geladen, wie sie vom Server kommt. Dass ein Browser sie normalerweise in einer Form darstellt, die von Menschen besser lesbar ist, dafür ist der Browser verantwortlich. Was willst Du eigentlich erreichen?
Re: urllib gibt immer nur die Seiten in html Format aus
Verfasst: Donnerstag 6. Juni 2019, 15:36
von egon11
Sirius3 hat geschrieben: Donnerstag 6. Juni 2019, 15:19
Was willst Du eigentlich erreichen?
Ich hab mir das urllib modul mal angeschaut, und getestet. Dabei bin ich auf dieses "Problem" gestoßen, ich dachte man kann mit
etwas machen.
Re: urllib gibt immer nur die Seiten in html Format aus
Verfasst: Donnerstag 6. Juni 2019, 15:50
von __blackjack__
@egon11: Ja mit `urllib.parse` kann man etwas machen – URLs parsen und zusammensetzen. Das hat nichts mit HTML zu tun.
Re: urllib gibt immer nur die Seiten in html Format aus
Verfasst: Donnerstag 6. Juni 2019, 15:57
von __deets__
Es gibt das Modul webbrowser. Damit oeffnet Python eine URL mit dem Browser. Vielleicht hilft dir das.
Re: urllib gibt immer nur die Seiten in html Format aus
Verfasst: Donnerstag 6. Juni 2019, 16:06
von egon11
Ok, ich dachte ich kann mir den Text von einer beliebigen URL Adresse einlesen lassen, aber das klappt aber z.b. bei webdav, da sind es nur Dateien und ich kann mir den Text in Python anzeigen lassen.
trotzdem vielen dank.