Spider/Crawler für vorbestimmte IP-Range nach robot.txt Inhalten!

Sockets, TCP/IP, (XML-)RPC und ähnliche Themen gehören in dieses Forum
Antworten
Benutzeravatar
Pu73
User
Beiträge: 1
Registriert: Samstag 27. Februar 2016, 14:11

Spider/Crawler für vorbestimmte IP-Range nach robot.txt Inhalten!? -> Oder doch besser und schneller mit bash?

Und gleich noch eine Frage hinterher! -> Modul "netaddr"

from netaddr import iter_iprange
generator = iter_iprange(192.168.10.1, 192.168.11.255, step=1)
...

Wie kann ich die beiden IP Adressen mit vorher abgeforderten IP-Adressen (Variablen) austauschen?

Lieben Dank im Voraus!
Sirius3
User
Beiträge: 17710
Registriert: Sonntag 21. Oktober 2012, 17:20

@Pu73: was besser oder schneller ist, hängt von dem ab, was Du kannst und was Du machen willst. Und wie man mit Variablen arbeitet sollte in jedem Grundlagentutorial vorkommen und kommt auch im Tutorial von netaddr vor.
Benutzeravatar
/me
User
Beiträge: 3554
Registriert: Donnerstag 25. Juni 2009, 14:40
Wohnort: Bonn

Pu73 hat geschrieben:generator = iter_iprange(192.168.10.1, 192.168.11.255, step=1)
...

Wie kann ich die beiden IP Adressen mit vorher abgeforderten IP-Adressen (Variablen) austauschen?
Das ist ungültiges Python. Die Adressen müssen als String angegeben werden.

Eine Variable verwendest du, indem du sie dort ... na ja, halt verwendest. Statt den String direkt dorthin zu schreiben kannst du natürlich auch auch einen Bezeichner nehmen der auf einen entsprechenden String verweist. Warum sollte das hier anders sein als sonst in Python?
Benutzeravatar
jens
Python-Forum Veteran
Beiträge: 8502
Registriert: Dienstag 10. August 2004, 09:40
Wohnort: duisburg
Kontaktdaten:

In django-tools hab ich:

[Codebox=python file=Unbenannt.py]from django_tools.settings_utils import InternalIps

INTERNAL_IPS = InternalIps(["127.0.0.1", "::1", "192.168.*.*", "10.0.*.*"])[/Codebox]

https://github.com/jedie/django-tools/b ... s_utils.py

GitHub | Open HUB | Xing | Linked in
Bitcoins to: 1JEgSQepxGjdprNedC9tXQWLpS424AL8cd
Antworten