Die Suche ergab 2 Treffer

von Herberth Amaral
Sonntag 2. Mai 2010, 12:27
Forum: Allgemeine Fragen
Thema: crawler selber schreiben bräuchte Tipps
Antworten: 8
Zugriffe: 2052

@Herberth Amaral: You shouldn't use BeautifulSoup, at least not for parsing. It is not maintained anymore and can't easily be ported to Python 3 without loosing quality.

Use html5lib or lxml.html, both handle malformed HTML. I recommend the latter. Being implemented atop of libxml2, it is the ...
von Herberth Amaral
Sonntag 2. Mai 2010, 04:14
Forum: Allgemeine Fragen
Thema: crawler selber schreiben bräuchte Tipps
Antworten: 8
Zugriffe: 2052

Re: crawler selber schreiben bräuchte Tipps


Edit: Hier wär noch was, die Übersetzung sieht auf den ersten Blick ganz brauchbar aus.
http://translate.google.com/translate?hl=en&sl=pt&tl=en&u=http%3A%2F%2Fherberthamaral.com%2F2010%2F02%2Fcriando-web-crawlers-em-python-parte-i%2F

Edit2: Nur der Code ist so falsch dargestellt, den musst dir ...