RSS Items identifizieren

Alles, was nicht direkt mit Python-Problemen zu tun hat. Dies ist auch der perfekte Platz für Jobangebote.
Antworten
rayo
User
Beiträge: 773
Registriert: Mittwoch 5. November 2003, 18:06
Wohnort: Schweiz
Kontaktdaten:

Mittwoch 6. Oktober 2004, 09:06

Hi

Ich schreib mir grad in Python ein Proggi für RSS Newsfeeds.
Jetzt überlege ich schon die ganze Zeit wie ich ein Item (eine Nachricht) identifizieren soll, einige schicken Unique IDs mit, andere nur das Datum und schlechte gar nichts.

Damit nicht eine Nachricht 2Mal angezeigt wird muss ich die ja unterscheiden.
Also solange es eine Unique ID hat kein Problem, nur ohne weiss ich noch nicht so recht wie.

Also ich bin soweit:
Auf den Link zum ganzen Artikel gehen oder einen MD5 Hash speichern

oder habt ihr andere Ideen?

Zur Hilfe: Die meisten schicken einen Titel eine Beschreibung und einen Link auf den ganzen Artikel

gruss
Dookie
Python-Forum Veteran
Beiträge: 2010
Registriert: Freitag 11. Oktober 2002, 18:00
Wohnort: Salzburg
Kontaktdaten:

Mittwoch 6. Oktober 2004, 12:51

Hi rayo,

ich denke mal daß der Link als Identifikation am besten geeignet ist. Ich würde die Links in eine Liste schreiben und dann jeweils testen, if link not in linklist ob der Link nicht schon verwendet wurde.


Gruß

Dookie
[code]#!/usr/bin/env python
import this[/code]
rayo
User
Beiträge: 773
Registriert: Mittwoch 5. November 2003, 18:06
Wohnort: Schweiz
Kontaktdaten:

Mittwoch 6. Oktober 2004, 14:03

Hi

Hab auch zum link tendiert, aber es wird sowieso in eine MySQL Datenbank geschrieben, weil es später mal via Web RSS-News sammelt und wieder auf einer Webseite (oder RSS Feed) zusammenfasst. Jeder Benutzer kann dann seine RSS Feeds jederzeit anschauen oder via Programm als XML downloaden.

Gruss
Antworten