SchneiderWeisse hat geschrieben:Verstehe nicht, was gegen Selenium spricht? Beliebiger Browser + selenium-server, der Rest lässt sich in 10 Zeilen Code erledigen. Man muss die Welt ja nicht neu erfinden.
Sollte man Seiten Testen wollen mag Selenium ganz gut sein aber sobald man dass Testen auf einem Server passieren soll hat man ein Problem.
cryzed hat geschrieben:Der Tokenizer schaut jetzt wie ein HTML Parser aus, oder irre ich mich?
Der Tokenizer sieht aus wie ein Tokenizer. Ich wollte nur darauf aufmerksam machen, dass dort sehr oft was mit `script` vorkommt - wie gesagt. Für den Parser: HTMLParser
cryzed hat geschrieben:Der Tokenizer schaut jetzt wie ein HTML Parser aus, oder irre ich mich?
Der Tokenizer sieht aus wie ein Tokenizer. Ich wollte nur darauf aufmerksam machen, dass dort sehr oft was mit `script` vorkommt - wie gesagt. Für den Parser: HTMLParser
Ach wirklich? Und im Endeffekt ist das ja Teil des Parser, danach schaut der Code zumindest aus. Und ich glaube Script kommt da drin auch nur vor damit man natürlich auch JavaScript Teile tokenizen kann.
Ich hatte gehofft, dass irgendwo in diesem Prozess die JavaScript Engine involviert ist, um die Scriptteile auszuführen und zu interpretieren, z.B. den DOM-Tree zu verändern. Wenn der Tokenizer fähig ist, JS-Teile zu erkennen und dann beispielsweise ein bestimmtes Attribut setzt, könnte dieses immer noch an anderer Stelle verarbeitet werden. Möglicherweise verstehst du auch wesentlich mehr von C++ als ich und hast dir auch schon deinen Reim daraus gemacht. Es sollte ja nur ein Hinweis sein...