Vorab Python ist die erste Programmiersprache, an die ich mich heranwage.
Mein erstes Programm soll von einer Webseite alle "href" links heraus filter und danach in eine Datei schreiben.
Das klappt so weit auch mit BeautifulSoup. Mein Problem besteht daran das mir keine Lösung in den Sinn kommt wie ich den "print output --> for line in link:" in eine Datei bekomme.
Selbstverständlich ist mir der Umgang wie grundsätzlich etwas in Dateien schreibt bekannt.
Code: Alles auswählen
file = open(datei,"w")
file.write(text)
file.close()
Code: Alles auswählen
from BeautifulSoup import BeautifulSoup
import urllib2
import re
html_page = urllib2.urlopen('http://example.com')
soup = BeautifulSoup(html_page)
link = soup.findAll('a')
for line in link:
print line.get('href')
Mit freundlichen Grüßen
EDIT ba Damaskus: URL geändert!