Zeichen aus einem String entfernen.
Verfasst: Montag 21. März 2011, 12:35
Hi.
Ich möchte ein Programm schreiben das den Quellcode von Seiten ausliest und ihn dann abspeichert.
Jetzt ist das Problem beim speichern der Datei, ich möchte das die Datei den gleichen Namen wie die Webseite hat, da aber unter Linux die Dateinamen keine // enthalten darf geht das aber nicht.
Dann hatte ich die Idee alles was vor und nach der Webseitenadress ist zu löschen bsp. http://youtube.com/ wird einfach zu "youtube"
Hier einmal der code:
Ps. Ich kenne google aber weis nicht unter was ich googeln soll, wenn ihr also eine Seite kennt wo es beschrieben steht könnt ihr auch eifach diese posten 
Ich möchte ein Programm schreiben das den Quellcode von Seiten ausliest und ihn dann abspeichert.
Jetzt ist das Problem beim speichern der Datei, ich möchte das die Datei den gleichen Namen wie die Webseite hat, da aber unter Linux die Dateinamen keine // enthalten darf geht das aber nicht.
Dann hatte ich die Idee alles was vor und nach der Webseitenadress ist zu löschen bsp. http://youtube.com/ wird einfach zu "youtube"
Hier einmal der code:
Code: Alles auswählen
import urllib
website = raw_input("Wie heist die Seite?: ")
html = urllib.urlopen(website).read()
fobj = open(website, "a")
print html
fobj.write(html)
fobj.close