Die Suche ergab 6 Treffer
- Mittwoch 3. Mai 2017, 06:58
- Forum: Allgemeine Fragen
- Thema: Verwendung / Beschreibung von requests.post
- Antworten: 2
- Zugriffe: 769
Re: Verwendung / Beschreibung von requests.post
Ich glaube nicht das Du ein Problem bekommst. Allerdings würde ich mich Fragen was der Server dazu sagt, wenn Du ihn zyklisch mit Anfragen zuschießt. Wie häufig ist bei Dir zyklisch? Hast Du Zugriff auf den Server?
- Mittwoch 3. Mai 2017, 06:51
- Forum: Allgemeine Fragen
- Thema: String zu Hex-Array konvertieren
- Antworten: 8
- Zugriffe: 7410
Re: String zu Hex-Array konvertieren
Eine Möglichkeit wäre:
>>> test = 'TEST'
>>> mybytes = bytearray()
>>> mybytes.extend(map(ord, test))
>>> print('test: ' + str(mybytes.hex()))
test: 54455354
Wenn es von einer Ganzzahl kommt:
>>> zahl = 123456
>>> zbytes = zahl.to_bytes(4, byteorder='big', signed=False)
>>> print('zahl ...
>>> test = 'TEST'
>>> mybytes = bytearray()
>>> mybytes.extend(map(ord, test))
>>> print('test: ' + str(mybytes.hex()))
test: 54455354
Wenn es von einer Ganzzahl kommt:
>>> zahl = 123456
>>> zbytes = zahl.to_bytes(4, byteorder='big', signed=False)
>>> print('zahl ...
- Dienstag 2. Mai 2017, 10:48
- Forum: Webframeworks
- Thema: Hilfe beim Auslesen einer Website
- Antworten: 11
- Zugriffe: 4582
Re: Hilfe beim Auslesen einer Website
@alienskin: es scheint wohl, dass der Seitenbetreiber explizit das Crawlen verbietet. Ob es da ratsam ist, durch Täuschung die Nutzungsbedingungen zu umgehen, sei jedem selbst überlassen.
Ja stimmt. Wie konnte ich das in meiner Überschwänglichkeit nur übersehen...
@Moderatoren: Bitte löscht ...
Ja stimmt. Wie konnte ich das in meiner Überschwänglichkeit nur übersehen...
@Moderatoren: Bitte löscht ...
- Dienstag 2. Mai 2017, 09:57
- Forum: Webframeworks
- Thema: Hilfe beim Auslesen einer Website
- Antworten: 11
- Zugriffe: 4582
Re: Hilfe beim Auslesen einer Website
Wenn man `request.session` verwendet, macht es Sinn die Sachen die sich bei den Anfragen nicht ändern, also in diesem Falle den User-Agent-Header, auf der Sitzung zu setzen und nicht bei den Anfragen anzugeben.
Ja Full ACK.
Die Typpräfixe wie `intSomething` oder `listSomething` gehören da ...
Ja Full ACK.
Die Typpräfixe wie `intSomething` oder `listSomething` gehören da ...
- Dienstag 2. Mai 2017, 09:21
- Forum: Webframeworks
- Thema: Hilfe beim Auslesen einer Website
- Antworten: 11
- Zugriffe: 4582
Re: Hilfe beim Auslesen einer Website
Versuchst Du den Server mit für ihn sinnvollen und vor allem verständlichen Anfragen zu belästigen:
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
import requests
from bs4 import BeautifulSoup
USERAGENT = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_4) AppleWebKit/537.36 (KHTML, like Gecko ...
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
import requests
from bs4 import BeautifulSoup
USERAGENT = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_4) AppleWebKit/537.36 (KHTML, like Gecko ...
- Dienstag 2. Mai 2017, 08:54
- Forum: Webframeworks
- Thema: Hilfe beim Auslesen einer Website
- Antworten: 11
- Zugriffe: 4582
Re: Hilfe beim Auslesen einer Website
Schaust Du Dir die Rückgabe von Deinem request.get an, wirst Du fest stellen, dass ein Fehlercode 404 zurück kommt :)
Das heißt es wird gemeldet:
"ScienceDirect does not support the use of the crawler software. If you have any questions please contact your helpdesk."
Das heißt, mit der Anfrage an ...
Das heißt es wird gemeldet:
"ScienceDirect does not support the use of the crawler software. If you have any questions please contact your helpdesk."
Das heißt, mit der Anfrage an ...