Seite 1 von 1

"Telnet -> HTTP -> Get" ergibt unsauberes HT

Verfasst: Freitag 6. November 2009, 11:05
von i1337
Hallo,
ich sende per Telnet "HTTP Get Befehle" an einen Server im Netzwerk.
Dann fange ich den HTML-Code ab und schreibe ihn in eine Datei.

Wenn ich die selbe Version der selben Seite vom selben Server mehrmals aufrufe, ändert sich der Code immer leicht, es schleichen sich 'Macken' ein.

z.B.
aus

Code: Alles auswählen

value="21" />
wird

Code: Alles auswählen

value="21 
"/>
aus

Code: Alles auswählen

width="WIDTH" />
wird

Code: Alles auswählen

w="W" />
aus
wird

Code: Alles auswählen

<
2c2
td


Ist das normal?
Liegt das an den Eingsetzen Mitteln (Telnet-Übertragungs-Art, HTML, Python)
oder an der Umgebung hier (Netzwerk, Server,.. )

Eigentlich sollen verschiedene Versionen der Seiten auf Unterschiede & Fehler untersucht werden, deshalb würde ich gern ohne Parser arbeiten, da ich nicht weiss ob dieser die gesuchten Fehler verschleiert.

lg.

Verfasst: Freitag 6. November 2009, 11:35
von Defnull
Warum zum Teufel nutzt du telnet?? --> urllib2

Verfasst: Freitag 6. November 2009, 11:53
von i1337
Bei der urllib2 ist die Autorisierung am Server nicht möglich.
Das ist ja mein Problem :D, würde gerne urllib2 nehmen, aber es geht nicht, bei Telnet scheint es da ein Sicherheits-Bug auf dem Server zugeben.

Würde bei der urllib2 Methode immer der selbe Code ankommen, ohne die Fehler die ich jetzt hae?

Verfasst: Freitag 6. November 2009, 13:45
von apollo13
i1337 hat geschrieben:Bei der urllib2 ist die Autorisierung am Server nicht möglich.
Wieso denn das?
bei Telnet scheint es da ein Sicherheits-Bug auf dem Server zugeben.
Hu?

Re: "Telnet -> HTTP -> Get" ergibt unsaubere

Verfasst: Samstag 7. November 2009, 09:24
von sma
i1337 hat geschrieben:Ist das normal?
Nein.

Urllib2 kann Basic und Digest Auth. Auch cookie-basierte Anmeldungen per Formular müssten eigentlich gehen. Wieso geht das also nicht und wieso muss es Telnet sein? Und wieso Telnet und nicht einfach so eine Socket-Verbindung. Das HTTP-Protokoll ist doch eines der einfachsten.

Stefan

Verfasst: Montag 9. November 2009, 14:34
von i1337
Also das Problem bei der Anmeldung in Urlib2 bestand mit dem Cookie Handler.
Aber ich besorge mir jetzt einfach die PHP-Sesion-ID weiterhin mit Telnet und den Rest mache ich jetzt mit Urllib2.

Ist den Telnet-Übertragung jetzt die Ursache für das 'Unvalide Html'?
Oder liegt es am Server?
Ich würde es gern wissen.

lg.

Verfasst: Montag 9. November 2009, 17:26
von i1337
mhm, viel besser ist es jetzt auch nicht geworden, liegt wohl doch am Server.