Mein Problem ist gleich am Anfang beim zerlegen in die Token.
Dafür wird ein reg. Ausdruck verwendet.
Nun steh ich vor den Problem wie ich Kommentare und Strings handle als ganzes.
Als Beispiel, Pascal kennt (* *) und { } als Kommentar, FreePascal/Delphi erlaubt noch //.
Nun sollen darin keine weiteren Token erkannt werden, was bei mir natürlich kollidiert mit den anderen Regeln wie für Zahlen etc.
Wie stelle ich nun das am besten an? Mein Ansatz[1] funktioniert so nat. nicht, bin auch nicht sonderlich geübt in RegEx.
[1]
Code: Alles auswählen
TOKENS = re.compile(r"\(\*.*?\*\)|\d+")