Die Suche ergab 4 Treffer

von Wuuzzaa
Montag 29. August 2011, 17:56
Forum: Netzwerkprogrammierung
Thema: Seitenquelltext von mrtzcmp3.net laden
Antworten: 5
Zugriffe: 2716

Re: Seitenquelltext von mrtzcmp3.net laden

Problem vorerst gelöst ;-)
hatte vergessen alle Seiten in den Cookiejar zu packen.

EDIT:

Hier mal der Code der zum richtigen Quelltext führt (auch ohne mechanize).

import urllib2
import cookielib

url1 = "http://www.mrtzcmp3.net/edguy_1s.html"
url2 = "http://www.mrtzc-download-server1.asia/Edguy ...
von Wuuzzaa
Montag 29. August 2011, 16:53
Forum: Netzwerkprogrammierung
Thema: Seitenquelltext von mrtzcmp3.net laden
Antworten: 5
Zugriffe: 2716

Re: Seitenquelltext von mrtzcmp3.net laden

Hi

habe es nun mit mechanize probiert - auch ohne Erfolg wieder die Fehlermeldung. Das Skript kam von http://stockrt.github.com/p/emulating-a-browser-in-python-with-mechanize/ .
Darin wurden auch der User Agent Header verändert und ein Cookiejar angelegt.

Muss mir wohl mit Firebug die Seite ...
von Wuuzzaa
Sonntag 28. August 2011, 22:23
Forum: Netzwerkprogrammierung
Thema: Seitenquelltext von mrtzcmp3.net laden
Antworten: 5
Zugriffe: 2716

Re: Seitenquelltext von mrtzcmp3.net laden

Danke für die Antworten. Habe mir mal mechanize angesehen. Bei einem Beispielskript wurden einfach die Header Dateien geändert. Würde das schon reichen - dann könnte ich auch auf die urllib2 lib zurückgreifen ?

class urllib2.Request(url[, data][, headers][, origin_req_host][, unverifiable])

werde ...
von Wuuzzaa
Sonntag 28. August 2011, 19:46
Forum: Netzwerkprogrammierung
Thema: Seitenquelltext von mrtzcmp3.net laden
Antworten: 5
Zugriffe: 2716

Seitenquelltext von mrtzcmp3.net laden

Hi,

ich bin gerade dabei einen Downloader für die Seite mrtzcmp3.net zu schreiben. Nur stoße ich nun auf das Problem , dass ich nicht den richtigen Seitenquelltext mit urllib.urlopen().read() bekomme sondern immer eine "Fehlermeldung" im Quelltext der Seite.

Am besten ein kleines Beispiel.
http ...