urllib gibt immer nur die Seiten in html Format aus

Sockets, TCP/IP, (XML-)RPC und ähnliche Themen gehören in dieses Forum
Antworten
egon11
User
Beiträge: 354
Registriert: Mittwoch 14. Dezember 2016, 20:59

Hallo, ich bin gerade dabei, etwas mit urllib zu schreiben. Wenn ich

Code: Alles auswählen

urllib.request.urlopen("url")
die Seite öffne bzw mir anzeigen möchte, kommt das immer in html Format.
Gibt es eine kurze Lösung, dass die Seite, oder zumindest der Text so ausgegeben wird, wie es auf der URL- Seite steht?
Sirius3
User
Beiträge: 17750
Registriert: Sonntag 21. Oktober 2012, 17:20

Die Seite wird so geladen, wie sie vom Server kommt. Dass ein Browser sie normalerweise in einer Form darstellt, die von Menschen besser lesbar ist, dafür ist der Browser verantwortlich. Was willst Du eigentlich erreichen?
egon11
User
Beiträge: 354
Registriert: Mittwoch 14. Dezember 2016, 20:59

Sirius3 hat geschrieben: Donnerstag 6. Juni 2019, 15:19 Was willst Du eigentlich erreichen?
Ich hab mir das urllib modul mal angeschaut, und getestet. Dabei bin ich auf dieses "Problem" gestoßen, ich dachte man kann mit

Code: Alles auswählen

urllib.parse
etwas machen.
Benutzeravatar
__blackjack__
User
Beiträge: 13111
Registriert: Samstag 2. Juni 2018, 10:21
Wohnort: 127.0.0.1
Kontaktdaten:

@egon11: Ja mit `urllib.parse` kann man etwas machen – URLs parsen und zusammensetzen. Das hat nichts mit HTML zu tun.
„All religions are the same: religion is basically guilt, with different holidays.” — Cathy Ladman
__deets__
User
Beiträge: 14541
Registriert: Mittwoch 14. Oktober 2015, 14:29

Es gibt das Modul webbrowser. Damit oeffnet Python eine URL mit dem Browser. Vielleicht hilft dir das.
egon11
User
Beiträge: 354
Registriert: Mittwoch 14. Dezember 2016, 20:59

Ok, ich dachte ich kann mir den Text von einer beliebigen URL Adresse einlesen lassen, aber das klappt aber z.b. bei webdav, da sind es nur Dateien und ich kann mir den Text in Python anzeigen lassen.

trotzdem vielen dank.
Antworten