
Ich habe auf Basis des Scraper Modules mir ein HTML-Parser als Code-optimizer
geschrieben. Es sind 2 Stufen(doppelt ausführen) möglich, wobei sich das Erscheinungsbild nach der 1. nicht verändern sollte.
Im Grunde sind es nur 2 Funktionen die 1. löscht unnötige <SPAN>tags (ein sogenanntes"Allgemeines Inline-Element"-siehe SelfHtml)
Wenn dieses keine Attribute besitzt oder wenn es welche hat und es mehrfach hintereinander vorkommt.
Die Zweite ist speziell auf, mit Zeilennummern Dokumentierten Script-code optimiert.
Sie fast alle <SPAN>tags vom Typ "gutter"(Zeilennummern) zusammen und unterteilt das gesamte Dokument in 2 Tabellenspalten. Somit wird besonders bei längeren ScriptDokus eine menge Code gesparrt.
Grund für dieses Script war der schlechte HTML Code(Css) der speziell mit dem jEdit Plugin Code2HTML erzeugt wird. Mit diesem Script müssten die Seiten weniger als halb so groß werden.


Hier ist das Modul natürlich als Referenz Code

Am Basis Code habe ich im Prinzip nichts geändert, nur die Variable "outlist" wurde der Scraper-class zugewiesen.
Kennt jemand andere Module dieser Art?