Anfängerfrage
Verfasst: Samstag 29. September 2012, 12:30
Hallo zusammen,
ich bin kein Programmierer, aber versuche mich gerade in das Daten-Scraping mit Hilfe von Python und Scraperwiki einzufinden. Ich möchte eine Liste mit Websites durchsuchen nach dem Muster:
www.beispiel.com/anfang/
www.beispiel.com/anfang_ende/
wobei ich nicht weiß, welche Ausdrücke zwischen den Slashes existieren. Es sollen also alle existierenden Seiten www.beispiel.com/*/ gescrapt werden.
Das muss irgendwie mit Beautiful Soup und/oder urllib2 funktionieren, aber ich habe ein Brett vor dem Kopf. Kann mir jemand helfen?
Herzlichen Dank!
ich bin kein Programmierer, aber versuche mich gerade in das Daten-Scraping mit Hilfe von Python und Scraperwiki einzufinden. Ich möchte eine Liste mit Websites durchsuchen nach dem Muster:
www.beispiel.com/anfang/
www.beispiel.com/anfang_ende/
wobei ich nicht weiß, welche Ausdrücke zwischen den Slashes existieren. Es sollen also alle existierenden Seiten www.beispiel.com/*/ gescrapt werden.
Das muss irgendwie mit Beautiful Soup und/oder urllib2 funktionieren, aber ich habe ein Brett vor dem Kopf. Kann mir jemand helfen?
Herzlichen Dank!