Hallo.
Ich habe eine kleine Schleife, die ein paar Dinge von einer Webseite speichert.
Nun forstet er die Website von oben nach unten durch und speichert meine Sachen.
Er speichert aber noch einige Sachen doppelt und dreifach ab (ist ja ganz klar, ein Icon z.B. wird ja mehrmals benutzt). Nun möchte ich immer stets vergleichen, ob er den Pfad/Link bereits kennt.
Wollte das eigentlich wie folgt lösen:
- .txt Datei erstellen
- Pfade/Links reinschreiben und jedes mal vergleichen, ob es den gleichen Link in der temprären .txt schon gibt. Wenn ja, überspringen!
- Am Ende der Funktion die Datei löschen.
Wollte nun fragen, ob Python sowas schon irgendwie mitbringt und automatisch temporäre Dateien erstellt und anschließend wieder löscht.
Wenn ja, wie nennt sich sowas?
Ps.
Achja btw:
Kenn wer nen guten Free-Webspace mit Python 2.6 drauf?
virtuelle Datei
Hallo,
ich würde diese Informationen, ob der Pfad bereites bekannt ist, nicht in einer extra Datei speichern.
Warum nicht einfach die Pfad-Angaben in einer Menge (Set) speichern, dann hast du auch das
Problem mit der Abfrage, ob schon vorhanden, mit geringem Aufwand erschlagen.
Falls du das ganze programmiert, zu Spaß an der Freund, dann wünsch ich diese.
Ansonsten gibts dafür schon ein sehr gutes Tool namens HTTrack.
Grüße
Stefan
Edit: da war wer schneller
ich würde diese Informationen, ob der Pfad bereites bekannt ist, nicht in einer extra Datei speichern.
Warum nicht einfach die Pfad-Angaben in einer Menge (Set) speichern, dann hast du auch das
Problem mit der Abfrage, ob schon vorhanden, mit geringem Aufwand erschlagen.
Falls du das ganze programmiert, zu Spaß an der Freund, dann wünsch ich diese.
Ansonsten gibts dafür schon ein sehr gutes Tool namens HTTrack.
Grüße
Stefan
Edit: da war wer schneller
Nein, dafür sind moderne Computer viel zu schnell. Ab fünf/sechsstellig kann man sich langsam Gedanken machen…Sync32 hat geschrieben:Sind diese Mengen denn auch "belastbar" ?
Oder kommt es zu Problemen, wenn ich da z.B. 500 Elemente drinne habe?
Aber dann sind Dateien erst recht nicht mehr geeignet. Dann ist nur noch ein DBS sinnvoll.Darii hat geschrieben:Nein, dafür sind moderne Computer viel zu schnell. Ab fünf/sechsstellig kann man sich langsam Gedanken machen…Sync32 hat geschrieben:Sind diese Mengen denn auch "belastbar" ?
Oder kommt es zu Problemen, wenn ich da z.B. 500 Elemente drinne habe?
„Lieber von den Richtigen kritisiert als von den Falschen gelobt werden.“
Gerhard Kocher
http://ms4py.org/
Gerhard Kocher
http://ms4py.org/
- noisefloor
- User
- Beiträge: 3854
- Registriert: Mittwoch 17. Oktober 2007, 21:40
- Wohnort: WW
- Kontaktdaten:
Genau, dann IMHO am besten ein KV-Store. Python hat ja ein paar (einfache) schon an Bord.ms4py hat geschrieben:Aber dann sind Dateien erst recht nicht mehr geeignet. Dann ist nur noch ein DBS sinnvoll.Darii hat geschrieben:Nein, dafür sind moderne Computer viel zu schnell. Ab fünf/sechsstellig kann man sich langsam Gedanken machen…Sync32 hat geschrieben:Sind diese Mengen denn auch "belastbar" ?
Oder kommt es zu Problemen, wenn ich da z.B. 500 Elemente drinne habe?
Wobei ich keinen Grund sehe, nicht das o.g. set zu nutzen. Es sei denn, du hast nur so 128 kB RAM
Gruß, noisefloor
Ui, welche den? Bin ja mal gespannt was ich da verpasst habe.noisefloor hat geschrieben:Genau, dann IMHO am besten ein KV-Store. Python hat ja ein paar (einfache) schon an Bord.Aber dann sind Dateien erst recht nicht mehr geeignet. Dann ist nur noch ein DBS sinnvoll.
- noisefloor
- User
- Beiträge: 3854
- Registriert: Mittwoch 17. Oktober 2007, 21:40
- Wohnort: WW
- Kontaktdaten:
Hallo,
Hast also nicht sooo viel verpasst.
Gruß, noisefloor
dumbdbm, anydbm und dann je nach Plattform noch ein paar andere. Richtig performant ist aber wohl nur bsddb, welches aber unter Python 3 nicht mehr vorhanden ist.DasIch hat geschrieben:Ui, welche den? Bin ja mal gespannt was ich da verpasst habe.noisefloor hat geschrieben:Genau, dann IMHO am besten ein KV-Store. Python hat ja ein paar (einfache) schon an Bord.Aber dann sind Dateien erst recht nicht mehr geeignet. Dann ist nur noch ein DBS sinnvoll.
Hast also nicht sooo viel verpasst.
Gruß, noisefloor