Python-Forum offline nutzen

Alles, was nicht direkt mit Python-Problemen zu tun hat. Dies ist auch der perfekte Platz für Jobangebote.
Benutzeravatar
Mawilo
User
Beiträge: 446
Registriert: Sonntag 22. Februar 2004, 10:58
Wohnort: Sachsen
Kontaktdaten:

Beitragvon Mawilo » Montag 24. November 2008, 09:41

Hallo,

ich möchte den alten Thread noch einmal "aufwärmen", da ich noch immer an einer Offline-Version des Forums interessiert bin. Gibt es dazu evtl. neue Ideen?

Grüße
Mawilo
sma
User
Beiträge: 3018
Registriert: Montag 19. November 2007, 19:57
Wohnort: Kiel

Beitragvon sma » Montag 24. November 2008, 10:37

Am einfachsten wäre natürlich, wenn die Forumssoftware dies beherrschen würde. Gears würde sich hierfür anbieten.

Ohne Mithilfe der Software fällt mir nur ein, alle neuen Beiträge jeweils systematisch von der Webseite zu "ernten" und in einer eigenen lokalen Datenbank zu speichern. Diese lässt sich dann mit einem eigenen Programm anzeigen. Schreibt man Antworten oder neue Beiträge, werden diese zunächst ebenfalls nur lokal angelegt und markiert. Dann man man zu einem bestimmten Zeitpunkt diese wie über das Webformular an die Forumssoftware schicken, falls diese nicht versucht, derartige "Bots" zu erkennen und zu ignorieren.

Das "Ernten" kann eigentlich nicht so schwer sein, da man über `http://www.python-forum.de/search.php?search_id=newposts` eine Liste aller Foren und Themen bekommt, in denen es etwas Neues gibt. Kann das auch mal mehr als eine Seite sein? Keine Ahnung.

Angenommen, ich hätte eine HTML-Bibliothek, in der ich wie mit JQuery nach Elementen suchen kann. Gibt es sowas vielleicht schon? Dann finde ich mit `table.forumline` die 5-spaltige Tabelle mit allen neuen Themen. Dort dann mit `span.forumlink > a.forumlink` die Namen und URLs der Foren und mit `span.topictitle > a.topictitle` die Namen und die URLs der Themen. Auf einer Themenseite gibt es auch wieder eine `table.forumline` wo ich den Autoren mit `td.row1 > span.name > b` und den Text mit `td.row1 > table td > span.postbody` extrahieren kann. Das Datum findet man hinter dem String "Verfasst am:" in `td.row1 > table td > span.postdetails`. Das ist IMHO alles, was man braucht.

Gibt es mehrere Seiten, wird der Startoffset einfach vor dem `.html` mit Komma an die URL gehängt. Ob man wohl auch irgendwie die Anzahl (normal ja 15) der Beiträge angeben kann? Dann könnte man immer alles als eine Seite holen.

Sehr praktisch wäre ja, wenn das Forum die neuen Beiträge als RSS- oder besser noch als ATOM-Feed zur Verfügung stellen würde. Dann würde ich erwarten, dass man mit ATOM-Pub auch wieder schreiben kann. Das wäre dann ein nettes und standardisiertes API.

Für eine Antwort könnte es reichen, ein ein POST an `posting.php` zu schicken, wobei der Text als `message` und die Topic-ID in `t` übergeben werden. Außerdem ist da noch ein `mode=reply` gesetzt. Das wäre dann auch nicht weiter schwer. Man muss sich natürlich zu vor programmatisch anmelden. Ich tippe darauf, dass die Credentials in einem Cookie gespeichert werden.

Stefan
Benutzeravatar
Leonidas
Administrator
Beiträge: 16023
Registriert: Freitag 20. Juni 2003, 16:30
Kontaktdaten:

Beitragvon Leonidas » Montag 24. November 2008, 12:33

sma hat geschrieben:Am einfachsten wäre natürlich, wenn die Forumssoftware dies beherrschen würde. Gears würde sich hierfür anbieten.

Ja. Wenn wir auf Inyoka umsteigen, werden wir mal gucken was man davon implementieren kann.
My god, it's full of CARs! | Leonidasvoice vs Modvoice
Benutzeravatar
Mawilo
User
Beiträge: 446
Registriert: Sonntag 22. Februar 2004, 10:58
Wohnort: Sachsen
Kontaktdaten:

Beitragvon Mawilo » Dienstag 25. November 2008, 09:46

Leonidas hat geschrieben:Ja. Wenn wir auf Inyoka umsteigen, werden wir mal gucken was man davon implementieren kann.


Wann ist das geplant?
lunar

Beitragvon lunar » Dienstag 25. November 2008, 10:15

Mawilo hat geschrieben:
Leonidas hat geschrieben:Ja. Wenn wir auf Inyoka umsteigen, werden wir mal gucken was man davon implementieren kann.


Wann ist das geplant?

Es kann gar nicht geplant werden, weil noch nicht mal geplant ist, wann inyoka freie Software wird ... und solange es nicht mal Code (von Veröffentlichungen rede ich gar nicht) gibt, lässt sich dieses Forum logischerweise nicht mit inyoka betreiben.
Benutzeravatar
Mawilo
User
Beiträge: 446
Registriert: Sonntag 22. Februar 2004, 10:58
Wohnort: Sachsen
Kontaktdaten:

Beitragvon Mawilo » Dienstag 25. November 2008, 10:46

Geht das Speichern nicht auch mit Tools wie Httrack oder WebSpider? Oder kommen die nicht mit der Forumsoftware zurecht?
Benutzeravatar
Leonidas
Administrator
Beiträge: 16023
Registriert: Freitag 20. Juni 2003, 16:30
Kontaktdaten:

Beitragvon Leonidas » Dienstag 25. November 2008, 11:49

lunar hat geschrieben:Es kann gar nicht geplant werden, weil noch nicht mal geplant ist, wann inyoka freie Software wird ...

Eigentlich irgendwann 2009...
My god, it's full of CARs! | Leonidasvoice vs Modvoice
lunar

Beitragvon lunar » Dienstag 25. November 2008, 14:29

Die Roadmap wurde mit Bedacht nicht mit Fälligkeitsdaten versehen, da diese kaum planbar sind und daher zum Teil wohl nicht eingehalten werden könnten.

Ich würde da nicht von Planung sprechen ...

Aber über Sinn und Unsinn dieser Roadmap haben wir ja schon mal diskutiert, dass muss nicht nochmal sein.
Benutzeravatar
Leonidas
Administrator
Beiträge: 16023
Registriert: Freitag 20. Juni 2003, 16:30
Kontaktdaten:

Beitragvon Leonidas » Dienstag 25. November 2008, 15:42

lunar hat geschrieben:Aber über Sinn und Unsinn dieser Roadmap haben wir ja schon mal diskutiert, dass muss nicht nochmal sein.

Dieser Roadmap? Ich dachte wir haben über die letzte Roadmap diskutiert, wo das Release November/Dezember versprochen wurde ;)
My god, it's full of CARs! | Leonidasvoice vs Modvoice
lunar

Beitragvon lunar » Dienstag 25. November 2008, 17:21

Ja, aber die Argumente sind ja die gleichen geblieben und zumindest auf meiner Seite hat sich auch die Meinung nicht geändert. :)

Wer ist online?

Mitglieder in diesem Forum: Google [Bot], sls