Autovervollständigung von "Komodo Edit"

gerold · Sonntag 21. Dezember 2008, 19:13

Hallo!

Es hat mich mal wieder interessiert. Deshalb habe ich "Komodo Edit" installiert und ausprobiert. Entweder ich schaffe es nicht dieses Ding richtig einzustellen, oder die dort eingebaute Codevervollständigung für Python ist ein Witz.

Was muss man einstellen, dass nach Eingabe von "wx." die möglichen Objekte wie z.B. "wx.Frame" oder "wx.Panel" in der Liste auftauchen?

Oder wenn ich z.B. das hier eingebe:

Code: Alles auswählen

app = wx.PySimpleApp()

Dann möchte ich, dass nach erneutem Eingeben von ``app.`` auch die Methode ``app.MainLoop()`` aufscheint. -- Nichts!

Was muss man bei "Komodo Edit" einstellen, dass das funktioniert?

mfg
Gerold

fhoech · Sonntag 21. Dezember 2008, 20:41

Ich habe hier noch die 5.0.0-beta1 (Windows XP), da klappts auch irgendwie nur "halb bis garnicht".
Sprich, wenn ich den Code "import wx" stehen habe, und dann "wx." tippe, bekomme ich zwar eine (lange) Autovervollständigungs-Liste, aber es fehlt viel (z.B. wx.Frame und manches andere).
Bei deinem wx.PySimpleApp-Beispiel ist bei mir die Liste auch nicht vollständig. Ich kriege bei Eingabe von "app." nur zwei Einträge (OnInit und __init__).

burli · Sonntag 21. Dezember 2008, 22:02

Probiert mal Editra, da funktioniert das anscheinend recht gut. Bei dem genannten Beispiel bekomme ich bei app. jedenfalls ne laaaange Liste

BlackJack · Sonntag 21. Dezember 2008, 22:25

@gerold: Es ist halt immer die Frage ob eine IDE den Quelltext statisch analysiert, oder das Modul importiert und damit Seiteneffekte riskiert und der Inhalt von `wx.__all__` wird beim Importieren per Code aufgefüllt. Wenn eine IDE also `__all__` als Hinweis nimmt, was zur öffentlichen API gehört, kommt man mit statischer Analyse nicht weit.

sma · Montag 22. Dezember 2008, 11:08

Inzwischen bin ich der Überzeugung, dass eine dynamische und interaktive Programmiersprache wie Python von einer IDE nur dann gut unterstützt wird, wenn diese nicht eine tote Schablone des Programms (also nur die Dateien des Programms), sondern das aktive lebende Programm untersucht. Smalltalk funktionierte schon immer so; Lisp-Maschinen ebenfalls. Leider beisst sich das etwas mit dem Konzept von Dateien, aber die Welt ist nicht perfekt.

Der Slime-Mode des Emacs ist eigentlich ein schönes Beispiel, was es so ähnlich vielleicht schon für Python gibt oder wenn nicht, geben sollte.

Problematisch sind leider Seiteneffekte, die beim erneuten Laden von Modulen entstehen können. Hier muss man einfach entsprechende Konventionen einführen, das diese einem das System nicht zerschießen und einen Neustart erzwingen. Die "Uptime" eines solchen Systems sollte sich in Wochen und Monaten und nicht in Minuten oder Stunden messen lassen.

Bei Clojure finde ich beispielsweise den Gedanken faszinierend, einen Webserver mit einer Kommandozeile zu haben, über die ich jederzeit im laufenden Betrieb Änderungen, Ergänzungen oder einfach nur Status-Anfragen durchführen kann. Und das - im Gegensatz zu Seaside (mit Squeak-Smalltalk) - auch per SSH und dank screen auf einem entfernen Rechner von überall, wo ich eine Konsole habe. Seaside würde VNC benötigen.

Stefan

Lonestar · Montag 22. Dezember 2008, 11:56

BlackJack hat geschrieben:@gerold: Es ist halt immer die Frage ob eine IDE den Quelltext statisch analysiert, oder das Modul importiert und damit Seiteneffekte riskiert und der Inhalt von `wx.__all__` wird beim Importieren per Code aufgefüllt. Wenn eine IDE also `__all__` als Hinweis nimmt, was zur öffentlichen API gehört, kommt man mit statischer Analyse nicht weit.

Malzeit, also ich habe mich eigentlich noch nie damit befasst wie eine Codevervollständigung implementiert wird. Ich bin blauäugiger Weise immer davon ausgegangen das man einfach einmal den code ablaufen würde, und schon auf alle bekannten Objekte stoßen würde. Was dann wie gehandhabt wird war mir als Anwender immer egal. Nu bin ich aber neugierig geworden da es bei den Editoren und IDE's für Python ja schon erhebliche Unterschiede gibt.
Was gibts denn wenn ich den Programmcode einlese für Seiteneffekte? Wie gesagt - ich hab von dem Thema nicht wirklich Ahnung, eventuell gibts da ja was zum Einlesen in die Materie für nen unwissenden wie mich?

gerold · Montag 22. Dezember 2008, 12:14

Hallo!

Gut, dann bleibe ich bei WingIDE. Denn die Codevervollständigung funktioniert bei WingIDE fast perfekt. Und ohne gute Codevervollständigung müsste ich mir mehr merken als in mein kleines Hirn passt.

mfg
Gerold

cofi · Montag 22. Dezember 2008, 12:22

@Lonestar In Python kann alles dynamisch erzeugt werden, darum ist es mit einem einlesen - => statische Analyse - ja nicht getan, sondern der Code muss ausgeführt werden. Was das für Seiteneffekte sind, ist natürlich abhängig von dem jew. Code, aber ich denke das kann man sich ganz gut vorstellen

burli · Montag 22. Dezember 2008, 12:43

@Gerold: was ist mit Eclipse und PyDev?

gerold · Montag 22. Dezember 2008, 12:49

burli hat geschrieben:@Gerold: was ist mit Eclipse und PyDev?

Hallo burli!

Wer will denn schon für jede kleine Python-Datei ein Projekt anlegen...
Aber irgendwann werde ich PyDev mal wieder testen. Denn die Codevervollständigung von PyDev soll angeblich gar nicht so schlecht sein.

mfg
Gerold

burli · Montag 22. Dezember 2008, 12:53

Das ist wahr. Ohne Projekt geht bei Eclipse nicht. Aber wer braucht für einzelne Dateien schon ne Autovervollständigung?

Ich würde dir da aber echt nochmal Editra an's Herz legen. Ist IMHO mittlerweile brauchbar

gerold · Montag 22. Dezember 2008, 13:00

Hallo burli!

burli hat geschrieben:Aber wer braucht für einzelne Dateien schon ne Autovervollständigung?

Ich!

burli hat geschrieben:Ich würde dir da aber echt nochmal Editra an's Herz legen.

Zum schnellen Durchsehen von Python-Dateien oder für kleine Änderungen ist es schon brauchbar. Zum Programmieren fehlen schon noch ein paar Dinge. Aber Editra ist ja ein Editor und keine IDE und als Editor gar nicht mal so schlecht.

mfg
Gerold

burli · Montag 22. Dezember 2008, 13:10

gerold hat geschrieben: Aber Editra ist ja ein Editor und keine IDE und als Editor gar nicht mal so schlecht.

Hm, was macht den Unterschied aus zwischen Editor und IDE? Ich finde, Editra fehlt nicht viel für eine Python IDE.

Ok, man merkt, das Editra eigentlich noch Alpha ist. Bei der aktuellen Version hab ich das Problem, das Editra abstürzt wenn man die Panels verschiebt.

Leonidas · Montag 22. Dezember 2008, 13:24

gerold hat geschrieben:Aber irgendwann werde ich PyDev mal wieder testen. Denn die Codevervollständigung von PyDev soll angeblich gar nicht so schlecht sein.

Bei mir hats letztens nicht gescheit getan. Und dann war da noch die Eclipse-Fürchterlichkeit an sich (schon mal versucht damit Java zu schreiben? Da blinkt und poppt dauernd was auf; wie soll man so arbeiten?).

gerold · Montag 22. Dezember 2008, 13:43

burli hat geschrieben:Hm, was macht den Unterschied aus zwischen Editor und IDE?

Hallo burli!

Ich will jetzt nicht die Features von WingIDE aufzählen. Schau' es dir an, dann weißt du was ich mir unter einer IDE vorstelle. Als IDE gehen bei mir also gerade mal Komodo, WingIDE und Eclipse durch. IDLE hat zwar einen Codebrowser und einen Debugger, aber ich sehe in IDLE nur den Ansatz einer brauchbaren IDE.

IDEs sind z.B. Visual Studio von Microsoft, Delphi, Adobe Flash, Adobe Dreamweaver, TopStyle, Visual Basic 6 oder SQL-Manager.

Für Python muss eine gute IDE, in meinen Augen, unter Anderem diese Features beherrschen:
- Syntax Highlighting
- gute Codevervollständigung ist das A und O (``s = "", x = s, x.`` spätestens beim letzten Punkt müssen die String-Methoden in der Liste auftauchen)
- Anzeige der Parameter und Docstrings der markierten Funktion, gehört einfach dazu. Und das nicht nur, wenn man die öffnende Klammer eingibt. Ich kann doch nicht jedes mal, wenn ich Infos über die Funktion brauche, die Klammer löschen und neu eingeben...
- Debugger
- - Breakpoints
- - Schrittweise Durchlaufen des Codes
- - Anzeige einer Aufrufliste (Call-Stack)
- - Nachverfolgung der Execptions (Traceback-Liste) und Springen zur fehlerhaften Zeile, wenn man den Traceback anklickt.
- Springen zur Definition, der markierten Funktion
- Automatisches Erkennen und Umwandeln des Dateiencodings
- Codebrowser (Objekte, Klassen, Funktionen, Methoden eines Moduls anzeigen)
- Automatische Code-Einrückung
- Auflistung der zum Programm gehörenden Module (Projektmanagement)

mfg
Gerold

burli · Montag 22. Dezember 2008, 14:04

@ Leonidas: PyDev blinkt?

Ich hab von dem Java Kram nix drauf. Ich nehme als Basis immer die CDT Version und installiere PyDev nach

@ Gerold: Siehste, Debugger hab ich vergessen. Ok, der fehlt bei Editra glaub ich komplett

OverNord · Montag 22. Dezember 2008, 14:09

Moin,

also, nachdem ich hier Visual Studio gelesen habe, habe ich doch mal meine Express Edition des Web Developers gestartet, und habe ein paar Zeilen in Python geschrieben. Ich musst feststellen, das diese IDE Python einigermaßen unterstützt. Das Syntax Highlighting funktioniert, genau so wie die Autovervollständigung. Das einzige was mir nicht so gut gefallen hat, ist das automatische Einrücken, welches nicht funktioniert hat. Debugger und Co. habe ich allerdings noch nicht ausprobiert.

mfg. Nord

sma · Montag 22. Dezember 2008, 14:35

Lonestar, es müssen mehrere Probleme gelöst werden: Du musst den Kontext der angeforderten Vervollständigung im Editor und Programm erkennen und du musst einen kompletten Überblick über alle Möglichkeiten haben und daraus die Vervollständigungsliste bilden. Für den Überblick brauchst du ein Repository, das ständig aktuell gehalten werden muss. Des weiteren willst du mögliche Vervollständigungen "intelligent" priorisieren. Der Editor muss dabei das wenigste Tun. Die Verwaltung des Repositories und das Verständnis der Programme scheint mir das größere Problem.

Wäre die Programmiersprache vollständig deklarativ und auch noch statisch typisiert, wäre es vergleichsweise einfach, ein solches Repository zu erstellen und aktuell zu halten. Leider ist Python weder das eine noch das andere. Auch den Kontext in einem nun statischen Stück Code zu finden wäre vergleichsweise einfach.

Betrachten wir daher zuerst eine idealisierte Programmiersprache:

Code: Alles auswählen

    module b
        import * from builtins
        export C
        
        class C
            var x: list[int] = []
            
            def m(x: int): int
                self.x << x
                return len(x)

    module a
        import C from b
        export main
        
        def main(args: list[str])
            c = C()
            for a in args
                print(c.m(int(a)))

Meine Sprache kennt Module, in deren Namensraum man Namen aus anderen Modulen importieren kann und die selbst wieder Namen exportieren. Ein Modul ist eine Folge von Klassen- oder Funktionsdefinitionen, niemals einfach nur Anweisungen. In einer Klasse kann ich Variablen und Methoden definieren. Alles hat einen Typ:

Code: Alles auswählen

    b      >> module
    C      >> class[C]
    C.x    >> list[int]
    C.m    >> fun[[C, int], int]
    a      >> module
    a.C    >> class[C]
    a.main >> fun[list[str], none]

Damit haben auch alle Teilausdrücke einen Typ - das Typsystem muss (siehe Scala) einfach mächtig genug sein, um hier möglichst ohne "cast" auszukommen.

Ich kann nun mit ModuleInfo, ClassInfo, VarInfo, MethodInfo und FunInfo sowie TypInfo Objekten eine Repräsentation des Quelltexts aufbauen, ohne ihn ausführen zu müssen, da die die Wirkung der Deklarationen kenne. Heraus kommt dann ein Repository, welches weiß, dass es drei Module (a, b und builtins) gibt, das a z.B. in der Datei "a.sma" und b in der Datei "b.sma" abgelegt ist, das b eine Klasse C definiert, diese wiederum eine Variable und eine Methode und wie deren Typen aussehen.

Jedes Mal, wenn sich der Quelltext ändert (bei Eclipse und Java ist das AFAIK nach 700ms Inaktivität des Benutzers nach einer Änderung oder so), rennt das System nun los und passt das Repository an. Eclipse unterstützt das System dadurch, dass Deltas vom Editor berechnet werden, anhand derer man - aufwendiger aber letztlich effizienter - nur so viel wie nötig jedes Mal verarbeiten muss.

Kommen wir zum Editor.

Angenommen, ich fordere in einer komplett leeren Datei die Komplettierung an. Der Kontext ist damit offenbar die Datei (a.k.a. compilation unit) und weil meine Sprache so aufgebaut ist, dass es immer mit `module` losgeht, ist das die einzige an dieser Stelle sinnvolle Vervollständigung.

Gleiches gilt, wenn ich nach `mod` um Hilfe bitte. Das ist an dieser Stelle ein Syntaxfehler, der Kontext ist also immer noch die Datei, die einzige mögliche Komplettierung `module`.

Alternativ könnte das System auch vermuten, dass ich wohl ein Schlüsselwort tippen wollte, weil ich (exklusive der drei Buchstaben) am Zeilenanfang stehe, und mir da alle möglichen Schlüsselworte anbieten und die Liste gleich auf alle, die mit `mod` beginnen einschränken. Schlüsselworte sind ein ärmlicher Default, aber besser als gar nix.

Wäre der Kontext der einer Funktion oder Methode, wäre auch ein Name denkbar. Dazu muss man nun die Liste der lokalen Variablen in der Funktion, die üblichen Pseudovariablen wie `self`, `true`, `false` oder `none`, sowie modullokalen und schließlich importierte Namen kennen; und dieser Reihenfolge anzeigen, falls sie überhaupt auf `mod` passen.

In einer Klasse als Kontext sind wieder `var` und `def` möglich. Meine Sprache ist absichtlich recht simpel.

In einem Kommentar könnte es sinnvoll sein, einfach beliebige Worte zu komplettieren, damit man Dampfdruckausstoßdüse nicht jedes Mal neu tippen muss. Diese Form der Komplettierung kann allgemein immer hilfreich sein, gerade wenn die Sprache nicht statisch komplett typisiert ist.

Spannender ist nun die Komplettierung hinter `self.` in einer Methode. Ich befinde mich in einer "Attributzugriffsposition". Das kann ich noch syntaktisch erkennen. Nun muss ich aber als nächstes den (statischen) Typ von `self` bestimmen. Für diesen Spezialfall ist es einfach, weiß ich doch, dass diese Pseudovariable für das Empfängerobjekt steht und ich somit, da ich auch weiß, zu welcher Klasse die Methode gehört, in meinem Repository nachschlagen, welche Variablen und Funktionen meine Klasse und alle Oberklassen so anbieten. Entdeckt man etwas wie `return expr.`, so kann man eine Nummer schlauer sein (Standard bei Java-IDEs) und spicken, welchen Rückgabetyp die Methode oder Funktion des Kontext hat und die Ergebnismenge passend priorisieren (filtern geht nicht, weil der Anwender die Kaskade noch weiterführen könnte).

Um den Typ eines Teilausdrucks zu berechnen, muss ich diesen komplett bis auf bekannte primitive Operationen herunter brechen und dann dann eine Typanalyse (in meinem Beispiel mit lokaler Typinferenz) durchführen. So sähe der Rumpf von `main` vielleicht so aus:

Code: Alles auswählen

    Block(
        Assignment(
            Local("c"), 
            Call(Name("C"))),
        For(Local("a"), Local("args"), Block(
            Call(Name("print"),
                Call(GetAttr(Local("c"), "m"),
                    Call(Name("int"), Local("a")))))))

Von innen nach außen: Der Typ von `a` in dem letzten `Local("a")` muss in dem Block bekannt sein, da die Variable durch das `for` gebunden wird. Diese weiß, dass sie auf den Typ von `args` die Funktion `iter()` anwenden muss, die ich nicht klug genug bin, korrekt zu typisieren, daher sage ich lieber, es wird `__iter__()` aufgerufen, welches im Falle einer `list[T]` als `fun[list[T], T]` definiert ist. Der Typ von `args` muss bekannt sein, er wird in den äußeren Block reingereicht. Nun kann ich aus `list[int]` und `fun[list[T], T]` ein T=int ableiten und somit ist `a` vom Typ `int`.

So mache ich weiter, bis ich alle Typen aller Teilausdrücke kenne. Der Typ von `c` ist beispielsweise der - oder ein generellerer - von `a`. Die Zuweisung überträgt auch den Typ. Spannend ist, dass ohne explizite Deklaration von Variablen, mögliche Typen auch später noch generischer werden können. Gerade als Bedingung in einem `if` macht das viel Spaß.

Am besten baut man aus dem Quelltext einen abstrakten Syntaxbaum (AST), den man mit Typinformationen annotiert und der weiterhin noch weiß, an welcher Stelle im Quelltext seine Bestandteile standen. In der Regel müsste hier ein Intervall reichen. Damit kann man dann für eine Vervollständigung einfach die Cursorposition nehmen und den Knoten des AST suchen, der gerade noch den Cursor enthält und somit zusammen mit allen seinen Vätern den Kontext vorgibt.

Man braucht dafür allerdings einen Parser, der sehr verzeihend ist und nicht nach dem ersten Fehler im Programm aufgibt, sondern so bald wie möglich wieder aufsetzt, um nicht fälschlich alles, was hinter einer unvollständigen Zeile steht, als Fehler zu verwerfen und so korrekte Definitionen (wenigstens zeitweise) aus dem Repository zu entfernen.

Auch muss man das System so tunen, dass ein öffnender Kommentar (falls es das gibt) oder mehrzeiliger String nicht den selben Effekt hat. Hier sollte sich das Repository so lange noch an den alten Stand erinnern, bis der Kommentar oder String wieder geschlossen wird.

Also: Eigentlich ist das alles gar nicht so schwer :) Mal abgesehen, von dem Typsystem, welches man benötigt, um das Programm "zu verstehen". EcmaScript 4 könnte interessant sein, da es versucht, auf eine eigentlich dynamische Sprache, ein statisches Typsystem aufzusetzen. Oder Fortress, welches typisierte Module hat. Deren Strukturtypen könnte man sich beispielsweise abschauen, da man glaube ich entsprechendes braucht. Alternativ helfen Traits als Sprachkonzept. Polymorphe Typen und Vereinigungstypen sind meines Wissens ebenfalls notwendig. Will man Tupel typisieren, was notwendig wird, sobald man mehrere Werte in einer Funktion zurückgeben kann, braucht man dafür ebenfalls Typausdrücke.

Was jetzt möglich wird, sind Refactorings. Eclipse und Java beispielsweise kennen in ihrem AST nicht nur die ursprünglichen Quelltextpositionen, sondern er ist ein derartiges Modell, dass wenn man den AST ändert, Eclipse automatisch den Quelltext im Editor anpasst. Dies macht etwa das gleichzeitige Ändern aller Vorkommen einer Variable leicht möglich; oder das Umschreiben von `import`-Anweisungen.

Angenommen, ich hätte in meiner Sprache eine Variante, dass ich

Code: Alles auswählen

    import foo as bar from baz

schreiben könnte. Habe ich nur dies:

Code: Alles auswählen

    import foo from baz
    def main()
        foo("...")

und will ich `foo` in `bar` umbenennen, muss das System schlau genug sein, und gleichzeitig, das `import` mit einem `as bar` ergänzen und außerdem warnen, falls es `bar` schon geben sollte.

Übungsaufgabe: Welchen Typ hat eigentlich der Teilausdruck `[]`?

Stefan

sma · Montag 22. Dezember 2008, 14:44

Ich möchte die Liste noch etwas ergänzen:

gerold hat geschrieben: - Debugger
- - Breakpoints
- - Schrittweise Durchlaufen des Codes
- - Anzeige einer Aufrufliste (Call-Stack)
- - Nachverfolgung der Execptions (Traceback-Liste) und Springen zur fehlerhaften Zeile, wenn man den Traceback anklickt.

mindestens noch watches, idealerweise kann ich im Debugger das Programm ändern und sofort weitermachen (Smalltalk), postmortem debuggen (geht auch in Smalltalk, wenn man zum Zeitpunkt der Exception einen dump zieht), einen Schritt wieder rückgängig machen (können Lisp-Debugger zum Teil, bei funktionalen Sprachen ist das einfach).

Dann möchte ich alternativ einen Trace sehen und Code Coverage im Editor sehen. Gerne darf mir der Editor auch den Code danach einfärben, wie effizient meine Konstrukte sind (konnte Dylan).

gerold hat geschrieben: - Springen zur Definition, der markierten Funktion

Und natürlich anders herum: References & Definitions. Konnte Smalltalk schon immer und Eclipse hat's dann übernommen. In einer Lisp-IDE habe ich die Funktion auch schon gesehen. Hilfreich kann auch ein kompletter Call-Tree sein.

Allgemein möchte ich wie in einem Webbrowser in dem Code durch anklicken der Namen browsen können (was Java-IDEs können und Smalltalk-IDEs theoretisch auch, wenn es denn damals schon die Webmetapher gegeben hätte).

Stefan

sma · Montag 22. Dezember 2008, 14:54

Leonidas hat geschrieben:Und dann war da noch die Eclipse-Fürchterlichkeit an sich (schon mal versucht damit Java zu schreiben? Da blinkt und poppt dauernd was auf; wie soll man so arbeiten?).

Dann tipp schneller :) Oder stelle die Verzögerungszeiten höher.

Wie's in Eclipse aktuell ist, kann ich nicht sagen, aber bei IDEA empfinde die Hilfen alles andere als störend. Man baut dort quasi die Programme wie in einem Struktureditor mit der Hilfe der Codevervollständigung zusammen.

Ungefähr so: "a() {". Return ergänzt, die zweite Klammer. Alt+Return ergänzt den fehlenden Rückgabetyp. "gSC". Strg+Space macht daraus "getStatusCode()" und bietet gleich an, die Parameter auszufüllen, falls sie da sind. Eclipse würde da sogar im Kontext vorhandene passende lokale Variablen eintragen. Jetzt mit Cmd+Shift+Left alles markieren und mit Alt+V (oder so ähnlich) IDEA das ganze einer lokalen Variable zuweisen lassen. Name wäre standardmäßig statusCode, kann aber geändert werden und IDEA merkt sie vorlieben in der Namensgebung und den Typ weiß er ja von der Funktion. Mit Konventionen wie IFoo oder FooImpl kommt er auch automatisch zurecht. Jetzt noch Strg+Return um das ";" am Ende zu setzen und in die nächste Zeile zu springen. Dort "s" schreiben, strg+Space erweitert das zu "statusCode", doch das macht keinen Sinn, IDEA ergänzt mit Alt+Return daher ein return Statement davon. Jetzt passt der Rückgabetyp nicht mehr, den ich mit nochmal Alt+Return korrigiere. Maus nicht einmal bewegt, kein überflüssiges syntaktisches Brimborium geschrieben. Das geht so echt schnell, wenn man daran gewöhnt ist.

Stefan