Seite 1 von 2

Verfasst: Montag 24. November 2008, 09:41
von Mawilo
Hallo,

ich möchte den alten Thread noch einmal "aufwärmen", da ich noch immer an einer Offline-Version des Forums interessiert bin. Gibt es dazu evtl. neue Ideen?

Grüße
Mawilo

Verfasst: Montag 24. November 2008, 10:37
von sma
Am einfachsten wäre natürlich, wenn die Forumssoftware dies beherrschen würde. Gears würde sich hierfür anbieten.

Ohne Mithilfe der Software fällt mir nur ein, alle neuen Beiträge jeweils systematisch von der Webseite zu "ernten" und in einer eigenen lokalen Datenbank zu speichern. Diese lässt sich dann mit einem eigenen Programm anzeigen. Schreibt man Antworten oder neue Beiträge, werden diese zunächst ebenfalls nur lokal angelegt und markiert. Dann man man zu einem bestimmten Zeitpunkt diese wie über das Webformular an die Forumssoftware schicken, falls diese nicht versucht, derartige "Bots" zu erkennen und zu ignorieren.

Das "Ernten" kann eigentlich nicht so schwer sein, da man über `http://www.python-forum.de/search.php?s ... d=newposts` eine Liste aller Foren und Themen bekommt, in denen es etwas Neues gibt. Kann das auch mal mehr als eine Seite sein? Keine Ahnung.

Angenommen, ich hätte eine HTML-Bibliothek, in der ich wie mit JQuery nach Elementen suchen kann. Gibt es sowas vielleicht schon? Dann finde ich mit `table.forumline` die 5-spaltige Tabelle mit allen neuen Themen. Dort dann mit `span.forumlink > a.forumlink` die Namen und URLs der Foren und mit `span.topictitle > a.topictitle` die Namen und die URLs der Themen. Auf einer Themenseite gibt es auch wieder eine `table.forumline` wo ich den Autoren mit `td.row1 > span.name > b` und den Text mit `td.row1 > table td > span.postbody` extrahieren kann. Das Datum findet man hinter dem String "Verfasst am:" in `td.row1 > table td > span.postdetails`. Das ist IMHO alles, was man braucht.

Gibt es mehrere Seiten, wird der Startoffset einfach vor dem `.html` mit Komma an die URL gehängt. Ob man wohl auch irgendwie die Anzahl (normal ja 15) der Beiträge angeben kann? Dann könnte man immer alles als eine Seite holen.

Sehr praktisch wäre ja, wenn das Forum die neuen Beiträge als RSS- oder besser noch als ATOM-Feed zur Verfügung stellen würde. Dann würde ich erwarten, dass man mit ATOM-Pub auch wieder schreiben kann. Das wäre dann ein nettes und standardisiertes API.

Für eine Antwort könnte es reichen, ein ein POST an `posting.php` zu schicken, wobei der Text als `message` und die Topic-ID in `t` übergeben werden. Außerdem ist da noch ein `mode=reply` gesetzt. Das wäre dann auch nicht weiter schwer. Man muss sich natürlich zu vor programmatisch anmelden. Ich tippe darauf, dass die Credentials in einem Cookie gespeichert werden.

Stefan

Verfasst: Montag 24. November 2008, 12:33
von Leonidas
sma hat geschrieben:Am einfachsten wäre natürlich, wenn die Forumssoftware dies beherrschen würde. Gears würde sich hierfür anbieten.
Ja. Wenn wir auf Inyoka umsteigen, werden wir mal gucken was man davon implementieren kann.

Verfasst: Dienstag 25. November 2008, 09:46
von Mawilo
Leonidas hat geschrieben: Ja. Wenn wir auf Inyoka umsteigen, werden wir mal gucken was man davon implementieren kann.
Wann ist das geplant?

Verfasst: Dienstag 25. November 2008, 10:15
von lunar
Mawilo hat geschrieben:
Leonidas hat geschrieben: Ja. Wenn wir auf Inyoka umsteigen, werden wir mal gucken was man davon implementieren kann.
Wann ist das geplant?
Es kann gar nicht geplant werden, weil noch nicht mal geplant ist, wann inyoka freie Software wird ... und solange es nicht mal Code (von Veröffentlichungen rede ich gar nicht) gibt, lässt sich dieses Forum logischerweise nicht mit inyoka betreiben.

Verfasst: Dienstag 25. November 2008, 10:46
von Mawilo
Geht das Speichern nicht auch mit Tools wie Httrack oder WebSpider? Oder kommen die nicht mit der Forumsoftware zurecht?

Verfasst: Dienstag 25. November 2008, 11:49
von Leonidas
lunar hat geschrieben:Es kann gar nicht geplant werden, weil noch nicht mal geplant ist, wann inyoka freie Software wird ...
Eigentlich irgendwann 2009...

Verfasst: Dienstag 25. November 2008, 14:29
von lunar
Die Roadmap wurde mit Bedacht nicht mit Fälligkeitsdaten versehen, da diese kaum planbar sind und daher zum Teil wohl nicht eingehalten werden könnten.
Ich würde da nicht von Planung sprechen ...

Aber über Sinn und Unsinn dieser Roadmap haben wir ja schon mal diskutiert, dass muss nicht nochmal sein.

Verfasst: Dienstag 25. November 2008, 15:42
von Leonidas
lunar hat geschrieben:Aber über Sinn und Unsinn dieser Roadmap haben wir ja schon mal diskutiert, dass muss nicht nochmal sein.
Dieser Roadmap? Ich dachte wir haben über die letzte Roadmap diskutiert, wo das Release November/Dezember versprochen wurde ;)

Verfasst: Dienstag 25. November 2008, 17:21
von lunar
Ja, aber die Argumente sind ja die gleichen geblieben und zumindest auf meiner Seite hat sich auch die Meinung nicht geändert. :)