Webscraping mit beautifulsoup4

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
Claudicard
User
Beiträge: 2
Registriert: Dienstag 24. Mai 2016, 18:33

Ich bin Neuling und möchte das Scraping mit Beautifulsoup lernen.
Ich habe auch beautifulsoup4 gedownloaded und request was wohl ein Module ist. Da pip install überhaupt nicht funktioniert habe ich einfach request und beautifulsoup in C:\Python verschoben. Aber es ist die Frage ob ich nicht einfach den Download Import habe denn diese Module werden nicht erkannt und pip install auch nicht. Import urllib ja z.B. aber Import request nein und beautifulsoup schon gar nicht.Das sind ja elementare Dinge die man braucht.
Ich vermute ja Pfadprobleme aber nach einigen Tagen Experimentalphase muss ich aufgeben und fragen.Ich habe python.exe als Ausgabefenster.
Über Hilfe freue ich mich.Danke.



Verzeichnis von C:\Python27

21.05.2016 09:17 128.946 beautifulsoup4-4.1.0.tar.gz
05.12.2015 20:33 27.136 python.exe
05.12.2015 20:33 27.648 pythonw.exe
23.05.2016 18:53 4.492 request-0.0.2.tar.gz
BlackJack

@Claudicard: Manuell in das Python-Verzeichnis einzugreifen ist gefährtlich wenn man nicht weiss was man da tut. Die Dateien, die Du dort hin verschoben hast sind komprimierte Archivdateien, die müsste man erst irgendwo entpacken und dann den Inhalt installieren. Meistens gibt es eine `setup.py`-Datei mit der man wie in der Python-Dokumentation beschrieben installieren kann. Aber ich würde erst einmal den Weg mit ``pip`` versuchen. Was heisst „funktioniert nicht“? Was hast Du genau gemacht, und was ist daraufhin genau passiert?

Bei aktuellen Python-Versionen (auch bei der aktuellen 2.7) ist ``pip`` bereits dabei, braucht also selbst nicht mehr installiert werden. Ich verwende ``pip`` mittlerweile direkt über die jeweilige Python-Version/-Installation, also ``python -m pip …`` wobei die Auslassungspunkte für die Argumente stehen die ``pip`` braucht. Also beispielsweise ``python -m pip install requests``.
Claudicard
User
Beiträge: 2
Registriert: Dienstag 24. Mai 2016, 18:33

Vielen Dank für die Antwort.
Ich habe erstmal das vorgeschlagene "python -m pip install requests" ausprobiert. Es scheint ohne Fehlerangabe zu funktionieren.Ist das nicht nur eine Ausgabe sondern eine Installation von requests? Muss leider auch danach fragen.In einem Tutorial wird z.b. $ pip install requests angegeben aber das erkennt python bei mir nicht an.
Dann dachte ich beautifulsoup4-4.1.0.tar ist eine Datei und müsste nicht entzipt werden, aber da man diese nicht einfach nach Python verschieben kann habe ich diese wieder zurück zu den Downloads geschoben und hoffentlich ohne Gefährlichkeit, möchte ja den PC nicht schrotten.
Python2.7 habe ich gedownloaded und in C:\ gespeichert. Dann habe ich beautifulsoup4 gedownloaded und in C:\gespeichert.Alles mit python packages.
Ich habe 2 Ausgabefenster ,einmal Windows und einmal python commandline.Es wurde gesagt besser mit Windows Fenster
zu arbeiten. Ich dachte eigentlich ich müsste nur nach dem beautiful Skript gehen und könnte dann Webseiten scrapen.Aber es fehlen mir noch viele wenn nicht alle Grundlagen.
Bei windowsfenster c:\ habe ich mit cd python27 und dann python die erwünschte Eingabeauffordung erreicht.
Ich werde ersteinmal Beautifulsoup entpacken und dann versuchen zu installieren. Und noch ein wenig die Grundlagen lernen.
Nochmals vielen Dank für die schnelle Antwort und Hilfe,ich werde sicherlich noch öfters hier nachfragen müssen.
Antworten