Metadaten von einem Blog speichern

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
velocity911
User
Beiträge: 6
Registriert: Sonntag 11. Dezember 2016, 14:48

Hallo liebes Forum!

Ich möchte gerne lernen, wie ich einen Server einrichten kann, der regelmäßig einen Blog (oder Website) auf Änderungen überprüft und die Metadaten bzw. neuen Inhalte speichert.

Welche Werkzeuge und Themen sollte ich mir dafür aneignen und in welcher Reihenfolge?

Meine IT-Erfahrungen begrenzen sich bisher rein auf das Programmieren mit ein bisschen SQL, ohne großartige frameworks oder so etwas. Von Webservern und Protokollen habe ich ebenso wie von Linux nur eine Ahnung und mal drüber gelesen.

Für eine Hilfestellung eurerseits bin ich sehr dankbar.

LG, velo
BlackJack

@velocity911: Das `requests`-Modul wäre wahrscheinlich interessant. Und BeautifulSoup4 und `lxml.html` um Inhalte aus HTML zu extrahieren. Falls die Blogs/Webseiten Newsfeeds haben, dann wäre das auch etwas was man sich anschauen könnte. Eventuell auch HTTP-Header, denn manche Seiten teilen den Stand der Webseite über Header mit, dann braucht man sich den Inhalt gegebenfalls nicht anschauen.
Antworten