Hallo,
ich möchte den alten Thread noch einmal "aufwärmen", da ich noch immer an einer Offline-Version des Forums interessiert bin. Gibt es dazu evtl. neue Ideen?
Grüße
Mawilo
Python-Forum offline nutzen
Am einfachsten wäre natürlich, wenn die Forumssoftware dies beherrschen würde. Gears würde sich hierfür anbieten.
Ohne Mithilfe der Software fällt mir nur ein, alle neuen Beiträge jeweils systematisch von der Webseite zu "ernten" und in einer eigenen lokalen Datenbank zu speichern. Diese lässt sich dann mit einem eigenen Programm anzeigen. Schreibt man Antworten oder neue Beiträge, werden diese zunächst ebenfalls nur lokal angelegt und markiert. Dann man man zu einem bestimmten Zeitpunkt diese wie über das Webformular an die Forumssoftware schicken, falls diese nicht versucht, derartige "Bots" zu erkennen und zu ignorieren.
Das "Ernten" kann eigentlich nicht so schwer sein, da man über `http://www.python-forum.de/search.php?s ... d=newposts` eine Liste aller Foren und Themen bekommt, in denen es etwas Neues gibt. Kann das auch mal mehr als eine Seite sein? Keine Ahnung.
Angenommen, ich hätte eine HTML-Bibliothek, in der ich wie mit JQuery nach Elementen suchen kann. Gibt es sowas vielleicht schon? Dann finde ich mit `table.forumline` die 5-spaltige Tabelle mit allen neuen Themen. Dort dann mit `span.forumlink > a.forumlink` die Namen und URLs der Foren und mit `span.topictitle > a.topictitle` die Namen und die URLs der Themen. Auf einer Themenseite gibt es auch wieder eine `table.forumline` wo ich den Autoren mit `td.row1 > span.name > b` und den Text mit `td.row1 > table td > span.postbody` extrahieren kann. Das Datum findet man hinter dem String "Verfasst am:" in `td.row1 > table td > span.postdetails`. Das ist IMHO alles, was man braucht.
Gibt es mehrere Seiten, wird der Startoffset einfach vor dem `.html` mit Komma an die URL gehängt. Ob man wohl auch irgendwie die Anzahl (normal ja 15) der Beiträge angeben kann? Dann könnte man immer alles als eine Seite holen.
Sehr praktisch wäre ja, wenn das Forum die neuen Beiträge als RSS- oder besser noch als ATOM-Feed zur Verfügung stellen würde. Dann würde ich erwarten, dass man mit ATOM-Pub auch wieder schreiben kann. Das wäre dann ein nettes und standardisiertes API.
Für eine Antwort könnte es reichen, ein ein POST an `posting.php` zu schicken, wobei der Text als `message` und die Topic-ID in `t` übergeben werden. Außerdem ist da noch ein `mode=reply` gesetzt. Das wäre dann auch nicht weiter schwer. Man muss sich natürlich zu vor programmatisch anmelden. Ich tippe darauf, dass die Credentials in einem Cookie gespeichert werden.
Stefan
Ohne Mithilfe der Software fällt mir nur ein, alle neuen Beiträge jeweils systematisch von der Webseite zu "ernten" und in einer eigenen lokalen Datenbank zu speichern. Diese lässt sich dann mit einem eigenen Programm anzeigen. Schreibt man Antworten oder neue Beiträge, werden diese zunächst ebenfalls nur lokal angelegt und markiert. Dann man man zu einem bestimmten Zeitpunkt diese wie über das Webformular an die Forumssoftware schicken, falls diese nicht versucht, derartige "Bots" zu erkennen und zu ignorieren.
Das "Ernten" kann eigentlich nicht so schwer sein, da man über `http://www.python-forum.de/search.php?s ... d=newposts` eine Liste aller Foren und Themen bekommt, in denen es etwas Neues gibt. Kann das auch mal mehr als eine Seite sein? Keine Ahnung.
Angenommen, ich hätte eine HTML-Bibliothek, in der ich wie mit JQuery nach Elementen suchen kann. Gibt es sowas vielleicht schon? Dann finde ich mit `table.forumline` die 5-spaltige Tabelle mit allen neuen Themen. Dort dann mit `span.forumlink > a.forumlink` die Namen und URLs der Foren und mit `span.topictitle > a.topictitle` die Namen und die URLs der Themen. Auf einer Themenseite gibt es auch wieder eine `table.forumline` wo ich den Autoren mit `td.row1 > span.name > b` und den Text mit `td.row1 > table td > span.postbody` extrahieren kann. Das Datum findet man hinter dem String "Verfasst am:" in `td.row1 > table td > span.postdetails`. Das ist IMHO alles, was man braucht.
Gibt es mehrere Seiten, wird der Startoffset einfach vor dem `.html` mit Komma an die URL gehängt. Ob man wohl auch irgendwie die Anzahl (normal ja 15) der Beiträge angeben kann? Dann könnte man immer alles als eine Seite holen.
Sehr praktisch wäre ja, wenn das Forum die neuen Beiträge als RSS- oder besser noch als ATOM-Feed zur Verfügung stellen würde. Dann würde ich erwarten, dass man mit ATOM-Pub auch wieder schreiben kann. Das wäre dann ein nettes und standardisiertes API.
Für eine Antwort könnte es reichen, ein ein POST an `posting.php` zu schicken, wobei der Text als `message` und die Topic-ID in `t` übergeben werden. Außerdem ist da noch ein `mode=reply` gesetzt. Das wäre dann auch nicht weiter schwer. Man muss sich natürlich zu vor programmatisch anmelden. Ich tippe darauf, dass die Credentials in einem Cookie gespeichert werden.
Stefan
-
- Python-Forum Veteran
- Beiträge: 16025
- Registriert: Freitag 20. Juni 2003, 16:30
- Kontaktdaten:
Ja. Wenn wir auf Inyoka umsteigen, werden wir mal gucken was man davon implementieren kann.sma hat geschrieben:Am einfachsten wäre natürlich, wenn die Forumssoftware dies beherrschen würde. Gears würde sich hierfür anbieten.
My god, it's full of CARs! | Leonidasvoice vs (former) Modvoice
Es kann gar nicht geplant werden, weil noch nicht mal geplant ist, wann inyoka freie Software wird ... und solange es nicht mal Code (von Veröffentlichungen rede ich gar nicht) gibt, lässt sich dieses Forum logischerweise nicht mit inyoka betreiben.Mawilo hat geschrieben:Wann ist das geplant?Leonidas hat geschrieben: Ja. Wenn wir auf Inyoka umsteigen, werden wir mal gucken was man davon implementieren kann.
-
- Python-Forum Veteran
- Beiträge: 16025
- Registriert: Freitag 20. Juni 2003, 16:30
- Kontaktdaten:
Eigentlich irgendwann 2009...lunar hat geschrieben:Es kann gar nicht geplant werden, weil noch nicht mal geplant ist, wann inyoka freie Software wird ...
My god, it's full of CARs! | Leonidasvoice vs (former) Modvoice
Ich würde da nicht von Planung sprechen ...Die Roadmap wurde mit Bedacht nicht mit Fälligkeitsdaten versehen, da diese kaum planbar sind und daher zum Teil wohl nicht eingehalten werden könnten.
Aber über Sinn und Unsinn dieser Roadmap haben wir ja schon mal diskutiert, dass muss nicht nochmal sein.
-
- Python-Forum Veteran
- Beiträge: 16025
- Registriert: Freitag 20. Juni 2003, 16:30
- Kontaktdaten:
Dieser Roadmap? Ich dachte wir haben über die letzte Roadmap diskutiert, wo das Release November/Dezember versprochen wurdelunar hat geschrieben:Aber über Sinn und Unsinn dieser Roadmap haben wir ja schon mal diskutiert, dass muss nicht nochmal sein.
My god, it's full of CARs! | Leonidasvoice vs (former) Modvoice
Ja, aber die Argumente sind ja die gleichen geblieben und zumindest auf meiner Seite hat sich auch die Meinung nicht geändert.