ANSI-Escape-Sequenz-Parser
Verfasst: Montag 14. November 2011, 00:33
Ich hab mal angefangen, den hier beschriebenen Parser in Python umzusetzen. Nun bin ich auf das Problem der Zeichenkodierung gestoßen und hab auch einen Hack für UTF8 drin, der allerdings alles andere als gut ist, da er mit anderen Steuerzeichen kollidiert. Leider schweigt sich die xterm-Doku hierzu aus und ich muß wohl tiefer in dessen Sourcecode abtauchen. Kennt jemand eine gute Quelle, die beschreibt, wie Terminals (bzw. locale) mit Charmaps umgehen?
Hier eine erste Version des Parsers.
Bis auf DCS-Kommandos (fehlen noch) und Kollisionen aufgrund des UTF8-Hacks sollte der Parser alle mögliche ESC-Sequenzen der VT-Reihe erkennen, sofern diese abwärtskompatibel zum VT500 sind (Ausnahmen siehe obigen Link zur Parser-Doku).
(Die FSM kommt von http://code.activestate.com/recipes/146 ... chine-fsm/ ).
Hier eine erste Version des Parsers.
Bis auf DCS-Kommandos (fehlen noch) und Kollisionen aufgrund des UTF8-Hacks sollte der Parser alle mögliche ESC-Sequenzen der VT-Reihe erkennen, sofern diese abwärtskompatibel zum VT500 sind (Ausnahmen siehe obigen Link zur Parser-Doku).
(Die FSM kommt von http://code.activestate.com/recipes/146 ... chine-fsm/ ).