"Telnet -> HTTP -> Get" ergibt unsauberes HT

Sockets, TCP/IP, (XML-)RPC und ähnliche Themen gehören in dieses Forum
Antworten
i1337
User
Beiträge: 11
Registriert: Mittwoch 23. September 2009, 15:39

Hallo,
ich sende per Telnet "HTTP Get Befehle" an einen Server im Netzwerk.
Dann fange ich den HTML-Code ab und schreibe ihn in eine Datei.

Wenn ich die selbe Version der selben Seite vom selben Server mehrmals aufrufe, ändert sich der Code immer leicht, es schleichen sich 'Macken' ein.

z.B.
aus

Code: Alles auswählen

value="21" />
wird

Code: Alles auswählen

value="21 
"/>
aus

Code: Alles auswählen

width="WIDTH" />
wird

Code: Alles auswählen

w="W" />
aus
wird

Code: Alles auswählen

<
2c2
td


Ist das normal?
Liegt das an den Eingsetzen Mitteln (Telnet-Übertragungs-Art, HTML, Python)
oder an der Umgebung hier (Netzwerk, Server,.. )

Eigentlich sollen verschiedene Versionen der Seiten auf Unterschiede & Fehler untersucht werden, deshalb würde ich gern ohne Parser arbeiten, da ich nicht weiss ob dieser die gesuchten Fehler verschleiert.

lg.
Benutzeravatar
Defnull
User
Beiträge: 778
Registriert: Donnerstag 18. Juni 2009, 22:09
Wohnort: Göttingen
Kontaktdaten:

Warum zum Teufel nutzt du telnet?? --> urllib2
Bottle: Micro Web Framework + Development Blog
i1337
User
Beiträge: 11
Registriert: Mittwoch 23. September 2009, 15:39

Bei der urllib2 ist die Autorisierung am Server nicht möglich.
Das ist ja mein Problem :D, würde gerne urllib2 nehmen, aber es geht nicht, bei Telnet scheint es da ein Sicherheits-Bug auf dem Server zugeben.

Würde bei der urllib2 Methode immer der selbe Code ankommen, ohne die Fehler die ich jetzt hae?
apollo13
User
Beiträge: 827
Registriert: Samstag 5. Februar 2005, 17:53

i1337 hat geschrieben:Bei der urllib2 ist die Autorisierung am Server nicht möglich.
Wieso denn das?
bei Telnet scheint es da ein Sicherheits-Bug auf dem Server zugeben.
Hu?
sma
User
Beiträge: 3018
Registriert: Montag 19. November 2007, 19:57
Wohnort: Kiel

i1337 hat geschrieben:Ist das normal?
Nein.

Urllib2 kann Basic und Digest Auth. Auch cookie-basierte Anmeldungen per Formular müssten eigentlich gehen. Wieso geht das also nicht und wieso muss es Telnet sein? Und wieso Telnet und nicht einfach so eine Socket-Verbindung. Das HTTP-Protokoll ist doch eines der einfachsten.

Stefan
i1337
User
Beiträge: 11
Registriert: Mittwoch 23. September 2009, 15:39

Also das Problem bei der Anmeldung in Urlib2 bestand mit dem Cookie Handler.
Aber ich besorge mir jetzt einfach die PHP-Sesion-ID weiterhin mit Telnet und den Rest mache ich jetzt mit Urllib2.

Ist den Telnet-Übertragung jetzt die Ursache für das 'Unvalide Html'?
Oder liegt es am Server?
Ich würde es gern wissen.

lg.
i1337
User
Beiträge: 11
Registriert: Mittwoch 23. September 2009, 15:39

mhm, viel besser ist es jetzt auch nicht geworden, liegt wohl doch am Server.
Antworten