Die Suche ergab 5 Treffer

von Fleyershaver
Freitag 20. Januar 2012, 18:26
Forum: Allgemeine Fragen
Thema: Subklassen einer Klasse als Instanz aufrufen
Antworten: 3
Zugriffe: 727

Re: Subklassen einer Klasse als Instanz aufrufen

Es handelt sich schon um ein konkreten Problem. In jede der Unterklassen wird jeweils eine bestimmte Webseite geparst durch die Funktion parse() geparst und später in der Datenbank gespeichert. Nun sind ein zurzeit ka. 30 Parser-Unterklassen die genau gleich aufgerufen und bearbeitet werden müssen ...
von Fleyershaver
Freitag 20. Januar 2012, 16:57
Forum: Allgemeine Fragen
Thema: Subklassen einer Klasse als Instanz aufrufen
Antworten: 3
Zugriffe: 727

Subklassen einer Klasse als Instanz aufrufen

Hallo,
ich arbeite gerade an einem Webseitenparser für Python und habe folgendes Problem:
Ich habe die Klasse Parser, welche sehr viele Unterklassen bzw... Unter-Unterklassen hat. Nun möchte ich jede dieser Klassen instanzieren(__init__() ausführen) und zusätzlich danach die Funktionen parse() und ...
von Fleyershaver
Mittwoch 21. September 2011, 17:13
Forum: Allgemeine Fragen
Thema: Webseiten parsen mit LXML
Antworten: 6
Zugriffe: 352

Re: Webseiten parsen mit LXML

@deets: Danke, genau das war mein Fehler...bei PHP hats komischerweise im Script mit div funktioniert.
von Fleyershaver
Mittwoch 21. September 2011, 16:56
Forum: Allgemeine Fragen
Thema: Webseiten parsen mit LXML
Antworten: 6
Zugriffe: 352

Re: Webseiten parsen mit LXML

Ich bin jetzt sogar noch einen Schritt weiter zurückgegeben um XPATH zu verstehen. Mein jetziger Quelltext sieht so aus:

from urllib.request import urlopen
import lxml.html as lh
p = lh.parse('http://animexx.onlinewelten.com/aidb/aod_episoden.php').getroot()

print(p)
print(p.xpath('//div[@id ...
von Fleyershaver
Mittwoch 21. September 2011, 12:41
Forum: Allgemeine Fragen
Thema: Webseiten parsen mit LXML
Antworten: 6
Zugriffe: 352

Webseiten parsen mit LXML

Hi,
ich habe einen Crawler in PHP und würde diesen gerne jetzt in Python umwandeln. Als Libery habe ich mich für XML entschieden, da es ja relativ schnell sein soll. In PHP sieht mein Code so aus:

$html = file_get_html("http://animexx.onlinewelten.com/aidb/aod_episoden.php");
$part = $html->find ...