Die Suche ergab 6 Treffer
- Donnerstag 8. Dezember 2022, 18:29
- Forum: Allgemeine Fragen
- Thema: Effektiv viele Dateien von Webseite herunterladen
- Antworten: 9
- Zugriffe: 868
Re: Effektiv viele Dateien von Webseite herunterladen
Da hast du recht. Hat keine logischen Grund. Ist einfach so einfacher für mich als Anfänger gewesen das alles zu trennen. Wenn ich mal alles soweit habe, dass es funktioniert wie ich will, kann ich auch zusammenfassen.
- Freitag 2. Dezember 2022, 22:50
- Forum: Allgemeine Fragen
- Thema: Effektiv viele Dateien von Webseite herunterladen
- Antworten: 9
- Zugriffe: 868
Re: Effektiv viele Dateien von Webseite herunterladen
Danke für das Feedback. Ist ein Freizeitprojekt und habe auch lange daran nichts gemacht und bin gerade jetzt dabei das wieder anzugehen und zu optimieren / weiter zu lernen, weshalb ich auch auf das Forum gestoßen bin. Werde versuchen das umsetzten / ändern ). Bin über jeden Tipp/Hinweis ...
- Freitag 2. Dezember 2022, 22:38
- Forum: Allgemeine Fragen
- Thema: Effektiv viele Dateien von Webseite herunterladen
- Antworten: 9
- Zugriffe: 868
Re: Effektiv viele Dateien von Webseite herunterladen
Danke, werde das mit dem "set" mal versuchen/recherchieren.
Das Skript liest eigentlich nur alle Links aus und speichert sie in einer Textdatei (2022_11_November.txt). Mit einem zweiten Skript gehe ich die Links dann durch und lade alles herunter, wenn es nicht schon auf der Festplatte (Pfad ...
Das Skript liest eigentlich nur alle Links aus und speichert sie in einer Textdatei (2022_11_November.txt). Mit einem zweiten Skript gehe ich die Links dann durch und lade alles herunter, wenn es nicht schon auf der Festplatte (Pfad ...
- Freitag 2. Dezember 2022, 22:14
- Forum: Allgemeine Fragen
- Thema: Effektiv viele Dateien von Webseite herunterladen
- Antworten: 9
- Zugriffe: 868
Re: Effektiv viele Dateien von Webseite herunterladen
Hier mal noch mein aktueller Code, der noch eine Einschränkung auf den Monat hat, sodass ich zumindest nur immer den aktuellen Monat neu crawle:
import os
import pathlib
import re
import time
import urllib.request
from datetime import datetime
from bs4 import BeautifulSoup
from pysitemap import ...
import os
import pathlib
import re
import time
import urllib.request
from datetime import datetime
from bs4 import BeautifulSoup
from pysitemap import ...
- Freitag 2. Dezember 2022, 20:20
- Forum: Allgemeine Fragen
- Thema: Effektiv viele Dateien von Webseite herunterladen
- Antworten: 9
- Zugriffe: 868
Re: Effektiv viele Dateien von Webseite herunterladen
Danke für deine Antwort. Läuft alles unter Linux und wird auch danach noch mit python-skripten weiter verarbeitet und in elastic indexiert.
wget kenne ich natürlich, mir ist aber nicht klar wie ich hier die Anforderung umsetzten kann, dass er eben nicht alle Seiten nochmal durchgeht, sondern das er ...
wget kenne ich natürlich, mir ist aber nicht klar wie ich hier die Anforderung umsetzten kann, dass er eben nicht alle Seiten nochmal durchgeht, sondern das er ...
- Dienstag 29. November 2022, 20:45
- Forum: Allgemeine Fragen
- Thema: Effektiv viele Dateien von Webseite herunterladen
- Antworten: 9
- Zugriffe: 868
Effektiv viele Dateien von Webseite herunterladen
Hallo zusammen,
ich suche nach einer Möglichkeit, wie ich den Download von sehr vielen + ständig neu hinzukommenden Dateien, effektiv bewerkstelligen kann. Derzeit habe ich es so implementiert, dass eine Linkliste erstellt wird und danach dann beim abarbeiten geprüft wird, ob es den Pfad schon gibt ...
ich suche nach einer Möglichkeit, wie ich den Download von sehr vielen + ständig neu hinzukommenden Dateien, effektiv bewerkstelligen kann. Derzeit habe ich es so implementiert, dass eine Linkliste erstellt wird und danach dann beim abarbeiten geprüft wird, ob es den Pfad schon gibt ...