virtuelle Datei

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
Sync32
User
Beiträge: 141
Registriert: Mittwoch 27. Januar 2010, 12:42

Hallo.
Ich habe eine kleine Schleife, die ein paar Dinge von einer Webseite speichert.
Nun forstet er die Website von oben nach unten durch und speichert meine Sachen.

Er speichert aber noch einige Sachen doppelt und dreifach ab (ist ja ganz klar, ein Icon z.B. wird ja mehrmals benutzt). Nun möchte ich immer stets vergleichen, ob er den Pfad/Link bereits kennt.
Wollte das eigentlich wie folgt lösen:
- .txt Datei erstellen
- Pfade/Links reinschreiben und jedes mal vergleichen, ob es den gleichen Link in der temprären .txt schon gibt. Wenn ja, überspringen!
- Am Ende der Funktion die Datei löschen.

Wollte nun fragen, ob Python sowas schon irgendwie mitbringt und automatisch temporäre Dateien erstellt und anschließend wieder löscht.
Wenn ja, wie nennt sich sowas?

Ps.
Achja btw:
Kenn wer nen guten Free-Webspace mit Python 2.6 drauf?
EyDu
User
Beiträge: 4881
Registriert: Donnerstag 20. Juli 2006, 23:06
Wohnort: Berlin

Hallo.

Warum denn der Umweg über Dateien?

Eine Suche nach "python temporary files" hilft übrigens ungemein ;-)

Sebastian
Das Leben ist wie ein Tennisball.
ms4py
User
Beiträge: 1178
Registriert: Montag 19. Januar 2009, 09:37

Warum speicherst du das nicht einfach im Memory mit einem `set`?
„Lieber von den Richtigen kritisiert als von den Falschen gelobt werden.“
Gerhard Kocher

http://ms4py.org/
rads
User
Beiträge: 153
Registriert: Freitag 26. März 2010, 15:51

Hallo,

ich würde diese Informationen, ob der Pfad bereites bekannt ist, nicht in einer extra Datei speichern.
Warum nicht einfach die Pfad-Angaben in einer Menge (Set) speichern, dann hast du auch das
Problem mit der Abfrage, ob schon vorhanden, mit geringem Aufwand erschlagen.

Falls du das ganze programmiert, zu Spaß an der Freund, dann wünsch ich diese.
Ansonsten gibts dafür schon ein sehr gutes Tool namens HTTrack.

Grüße

Stefan

Edit: da war wer schneller
Sync32
User
Beiträge: 141
Registriert: Mittwoch 27. Januar 2010, 12:42

Sind diese Mengen denn auch "belastbar" ?
Oder kommt es zu Problemen, wenn ich da z.B. 500 Elemente drinne habe?
Darii
User
Beiträge: 1177
Registriert: Donnerstag 29. November 2007, 17:02

Sync32 hat geschrieben:Sind diese Mengen denn auch "belastbar" ?
Oder kommt es zu Problemen, wenn ich da z.B. 500 Elemente drinne habe?
Nein, dafür sind moderne Computer viel zu schnell. Ab fünf/sechsstellig kann man sich langsam Gedanken machen…
ms4py
User
Beiträge: 1178
Registriert: Montag 19. Januar 2009, 09:37

Darii hat geschrieben:
Sync32 hat geschrieben:Sind diese Mengen denn auch "belastbar" ?
Oder kommt es zu Problemen, wenn ich da z.B. 500 Elemente drinne habe?
Nein, dafür sind moderne Computer viel zu schnell. Ab fünf/sechsstellig kann man sich langsam Gedanken machen…
Aber dann sind Dateien erst recht nicht mehr geeignet. Dann ist nur noch ein DBS sinnvoll.
„Lieber von den Richtigen kritisiert als von den Falschen gelobt werden.“
Gerhard Kocher

http://ms4py.org/
Benutzeravatar
noisefloor
User
Beiträge: 3853
Registriert: Mittwoch 17. Oktober 2007, 21:40
Wohnort: WW
Kontaktdaten:

ms4py hat geschrieben:
Darii hat geschrieben:
Sync32 hat geschrieben:Sind diese Mengen denn auch "belastbar" ?
Oder kommt es zu Problemen, wenn ich da z.B. 500 Elemente drinne habe?
Nein, dafür sind moderne Computer viel zu schnell. Ab fünf/sechsstellig kann man sich langsam Gedanken machen…
Aber dann sind Dateien erst recht nicht mehr geeignet. Dann ist nur noch ein DBS sinnvoll.
Genau, dann IMHO am besten ein KV-Store. Python hat ja ein paar (einfache) schon an Bord.

Wobei ich keinen Grund sehe, nicht das o.g. set zu nutzen. Es sei denn, du hast nur so 128 kB RAM ;-)

Gruß, noisefloor
DasIch
User
Beiträge: 2718
Registriert: Montag 19. Mai 2008, 04:21
Wohnort: Berlin

noisefloor hat geschrieben:
Aber dann sind Dateien erst recht nicht mehr geeignet. Dann ist nur noch ein DBS sinnvoll.
Genau, dann IMHO am besten ein KV-Store. Python hat ja ein paar (einfache) schon an Bord.
Ui, welche den? Bin ja mal gespannt was ich da verpasst habe.
BlackJack

@DasIch: Na zumindest mal das `shelve`-Modul.
Benutzeravatar
noisefloor
User
Beiträge: 3853
Registriert: Mittwoch 17. Oktober 2007, 21:40
Wohnort: WW
Kontaktdaten:

Hallo,
DasIch hat geschrieben:
noisefloor hat geschrieben:
Aber dann sind Dateien erst recht nicht mehr geeignet. Dann ist nur noch ein DBS sinnvoll.
Genau, dann IMHO am besten ein KV-Store. Python hat ja ein paar (einfache) schon an Bord.
Ui, welche den? Bin ja mal gespannt was ich da verpasst habe.
dumbdbm, anydbm und dann je nach Plattform noch ein paar andere. Richtig performant ist aber wohl nur bsddb, welches aber unter Python 3 nicht mehr vorhanden ist.

Hast also nicht sooo viel verpasst. ;-)

Gruß, noisefloor
Antworten