Hallo an alle, die hier lesen.
Ich habe eine Aufgabenstellung, für die ich die effektivste Lösung suche. Und zwar habe ich eine Liste mit lauter URLs. Ich möchte nun anhand der URLs die Domänen und IP Adressen rausnehmen und einzeln validieren. Hat jemand einen Vorschlag, wie man dieses einfach lösen kann? Regular Expression?!?
Danke im Voraus.
Volker
IP Adressen / DNS Namen aus URL Liste
Code: Alles auswählen
from socket import gethostbyname
from urlparse import urlparse
def get_dns(url):
netloc = urlparse(url).netloc
if not netloc:
# der Parser meckert nicht, wenn er was nicht versteht
# (z.B. Angabe ohne http:// davor)
raise ValueError, 'Unable to parse URL'
# schneidet den Port raus, falls vorhanden
return netloc.split(':')[0]
def get_ip(dns):
return gethostbyname(dns)