@Herberth Amaral: You shouldn't use BeautifulSoup, at least not for parsing. It is not maintained anymore and can't easily be ported to Python 3 without loosing quality.
Use html5lib or lxml.html, both handle malformed HTML. I recommend the latter. Being implemented atop of libxml2, it is the ...
Die Suche ergab 2 Treffer
- Sonntag 2. Mai 2010, 12:27
- Forum: Allgemeine Fragen
- Thema: crawler selber schreiben bräuchte Tipps
- Antworten: 8
- Zugriffe: 2052
- Sonntag 2. Mai 2010, 04:14
- Forum: Allgemeine Fragen
- Thema: crawler selber schreiben bräuchte Tipps
- Antworten: 8
- Zugriffe: 2052
Re: crawler selber schreiben bräuchte Tipps
Edit: Hier wär noch was, die Übersetzung sieht auf den ersten Blick ganz brauchbar aus.
http://translate.google.com/translate?hl=en&sl=pt&tl=en&u=http%3A%2F%2Fherberthamaral.com%2F2010%2F02%2Fcriando-web-crawlers-em-python-parte-i%2F
Edit2: Nur der Code ist so falsch dargestellt, den musst dir ...
