Anfrage an Website

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
picknicker187
User
Beiträge: 3
Registriert: Mittwoch 21. Februar 2007, 23:40

hi,

wahrscheinlich ist es ganz einfach und geht in 2 zeilen, ich weiss aber grad nicht wie ichs machen soll.....

und zwar will ich eine suchanfrage an eine website, zb sourceforge.net stellen und die suchergebnisse in einem string zurückbekommen. kann mir jemand einen tip geben wie ich das am besten mache?

gruß und danke,
michel
Benutzeravatar
nkoehring
User
Beiträge: 543
Registriert: Mittwoch 7. Februar 2007, 17:37
Wohnort: naehe Halle/Saale
Kontaktdaten:

Hi...

ehm... die Suchanfrage zu stellen, wie in einem Webbrowser und dann die zurueckgegebene HTML-Seite als String, oder wie?

EDIT: ich sehe gerade, das ist dein erster Beitrag... also erstmal: Willkommen hier im Forum ;)
[url=http://www.python-forum.de/post-86552.html]~ Wahnsinn ist auch nur eine andere Form der Intelligenz ~[/url]
hackerkey://v4sw6CYUShw5pr7Uck3ma3/4u7LNw2/3TXGm5l6+GSOarch/i2e6+t2b9GOen7g5RAPa2XsMr2
picknicker187
User
Beiträge: 3
Registriert: Mittwoch 21. Februar 2007, 23:40

ja, also die anfragen sind teile von tcp paketen und ich will kontrollieren ob es sich dabei um programme handelt, daher die anfrage an sourceforge. mit dem potentiellen programmnamen sollte eben eine suchanfrage an die website gestellt werden, wie als wenn ich es in das suchfeld eingebe. in der antwort will ich dann eben feststellen ob etwas gefunden wurde oder nicht, sprich ob es ein programm mit diesem namen gibt oder nicht.
sape
User
Beiträge: 1157
Registriert: Sonntag 3. September 2006, 12:52

Hi und willkommen im Forum.

http://sourceforge.net/search/?type_of_ ... rds=python

--> ?type_of_search=soft&words=python

python ist das Suchwort.


1. Das ganze mit ``urllib`` aufrufen und den content an
2. BeautifulSoup übergeben das einen AST erzeugt auf den man wirklich einfach darauf zurückgreifen kann.
3. Eventuell (je nach dem ob dus benötigst)die Page: 1 2 3 ... 326 Next »-Links mit BeautifulSoup rausfischen und dann bei 1. wider anfangen.

lg
Benutzeravatar
nkoehring
User
Beiträge: 543
Registriert: Mittwoch 7. Februar 2007, 17:37
Wohnort: naehe Halle/Saale
Kontaktdaten:

Ach du willst an sich nur herausfinden, ob es das programm gibt? Naja, dann wuerde es auch reichen, die Anfrage per urllib zu stellen und den zurueckgegebenen Content nach Stichworten ueberpruefen, die dir sicher bestaetigen, ob es das gibt oder nicht.
[url=http://www.python-forum.de/post-86552.html]~ Wahnsinn ist auch nur eine andere Form der Intelligenz ~[/url]
hackerkey://v4sw6CYUShw5pr7Uck3ma3/4u7LNw2/3TXGm5l6+GSOarch/i2e6+t2b9GOen7g5RAPa2XsMr2
sape
User
Beiträge: 1157
Registriert: Sonntag 3. September 2006, 12:52

Joa, und zwar müsste er folgendes extrahieren, mit re oder besser noch mir BeautifulSoup (weil einfacher):

Code: Alles auswählen

<tr><td colspan="7"><br /><b>No results were found to match your current search criteria.</b><br /><br /></tbody></table>
http://sourceforge.net/search/index.php ... rch=Search

EDIT: So auf die schnelle getestet scheint "No results were found to match your current search criteria." bei jeder anfrage zu kommen wenn nichts gefunden wurde.
Antworten