Neue Items in RSS-Feeds auslesen
Verfasst: Samstag 28. Dezember 2019, 15:06
Hallo,
ich möchte aus einem RSS-Feed, in dem Links zu neuen Beiträgen auf einer Website gepostet werden, neue Links auslesen und den Titel sowie den Artikeltext an mich per E-Mail senden lassen.
Mein Problem ist, das ich nicht weiß, wie ich "neue" Links erkennen lassen kann.
Mein Code bis jetzt:
Nun möchte ich aber überprüfen lassen, ob es neue Artikellinks gibt und diese dann entsprechend parsen. Hat da jemand eine Idee?
ich möchte aus einem RSS-Feed, in dem Links zu neuen Beiträgen auf einer Website gepostet werden, neue Links auslesen und den Titel sowie den Artikeltext an mich per E-Mail senden lassen.
Mein Problem ist, das ich nicht weiß, wie ich "neue" Links erkennen lassen kann.
Mein Code bis jetzt:
Code: Alles auswählen
#
###
#
import feedparser
import requests
import time
from bs4 import BeautifulSoup
from urllib.parse import urljoin
#
###
#
##RSS
# d
d = feedparser.parse('rsslink')
# laf = first-article-link
fal_rss_sl = d.entries[0]['link'] #1. Link auf der Website zu Artikel
sal_rss_sl = d.entries[1]['link']
tal_rss_sl = d.entries[2]['link']
#
###
#
def query_fal():
URL = fal_rss_sl
headers = {"User-Agent": 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36'}
page = requests.get(URL, headers=headers)
soup = BeautifulSoup(page.content, 'html.parser')
#
diva = soup.find ('div', attrs={'class':'card'})
#
title = soup.find('h1')
text = diva.div.next_sibling.next_sibling.next_sibling
query_fal()