Problem vorerst gelöst ;-)
hatte vergessen alle Seiten in den Cookiejar zu packen.
EDIT:
Hier mal der Code der zum richtigen Quelltext führt (auch ohne mechanize).
import urllib2
import cookielib
url1 = "http://www.mrtzcmp3.net/edguy_1s.html"
url2 = "http://www.mrtzc-download-server1.asia/Edguy ...
Die Suche ergab 4 Treffer
- Montag 29. August 2011, 17:56
- Forum: Netzwerkprogrammierung
- Thema: Seitenquelltext von mrtzcmp3.net laden
- Antworten: 5
- Zugriffe: 2716
- Montag 29. August 2011, 16:53
- Forum: Netzwerkprogrammierung
- Thema: Seitenquelltext von mrtzcmp3.net laden
- Antworten: 5
- Zugriffe: 2716
Re: Seitenquelltext von mrtzcmp3.net laden
Hi
habe es nun mit mechanize probiert - auch ohne Erfolg wieder die Fehlermeldung. Das Skript kam von http://stockrt.github.com/p/emulating-a-browser-in-python-with-mechanize/ .
Darin wurden auch der User Agent Header verändert und ein Cookiejar angelegt.
Muss mir wohl mit Firebug die Seite ...
habe es nun mit mechanize probiert - auch ohne Erfolg wieder die Fehlermeldung. Das Skript kam von http://stockrt.github.com/p/emulating-a-browser-in-python-with-mechanize/ .
Darin wurden auch der User Agent Header verändert und ein Cookiejar angelegt.
Muss mir wohl mit Firebug die Seite ...
- Sonntag 28. August 2011, 22:23
- Forum: Netzwerkprogrammierung
- Thema: Seitenquelltext von mrtzcmp3.net laden
- Antworten: 5
- Zugriffe: 2716
Re: Seitenquelltext von mrtzcmp3.net laden
Danke für die Antworten. Habe mir mal mechanize angesehen. Bei einem Beispielskript wurden einfach die Header Dateien geändert. Würde das schon reichen - dann könnte ich auch auf die urllib2 lib zurückgreifen ?
class urllib2.Request(url[, data][, headers][, origin_req_host][, unverifiable])
werde ...
class urllib2.Request(url[, data][, headers][, origin_req_host][, unverifiable])
werde ...
- Sonntag 28. August 2011, 19:46
- Forum: Netzwerkprogrammierung
- Thema: Seitenquelltext von mrtzcmp3.net laden
- Antworten: 5
- Zugriffe: 2716
Seitenquelltext von mrtzcmp3.net laden
Hi,
ich bin gerade dabei einen Downloader für die Seite mrtzcmp3.net zu schreiben. Nur stoße ich nun auf das Problem , dass ich nicht den richtigen Seitenquelltext mit urllib.urlopen().read() bekomme sondern immer eine "Fehlermeldung" im Quelltext der Seite.
Am besten ein kleines Beispiel.
http ...
ich bin gerade dabei einen Downloader für die Seite mrtzcmp3.net zu schreiben. Nur stoße ich nun auf das Problem , dass ich nicht den richtigen Seitenquelltext mit urllib.urlopen().read() bekomme sondern immer eine "Fehlermeldung" im Quelltext der Seite.
Am besten ein kleines Beispiel.
http ...