ich möchte aus einer Seite nach einem bestimmten Inhalt crawlen, meist aus einem "iframe"/"video" - Tag.
Den Inhalt,der gesucht wird, lautet wie folgt (ein Bsp.):
Code: Alles auswählen
<div id="AjaxStream" style="clear: both">
<iframe src="censored.html" width="100%" height="440px" allowfullscreen="true" webkitallowfullscreen="true" mozallowfullscreen="true" frameborder="0"></iframe>
</div>
Ich frage mich nur wieso? Ich verstehe das nicht...
Python Skript (das Wichtigste):
Code: Alles auswählen
self.hostHTML = self.session.get(self.url)
self.hostSOUP = bs(self.hostHTML.text,"html5lib")
print(self.hostSOUP.prettify())
xXSkyWalkerXx1