beautifulsoup installation

Probleme bei der Installation?
Antworten
its-lange
User
Beiträge: 3
Registriert: Dienstag 24. November 2015, 00:42

Hallo brache dringend Hilfe!
Ich Ich will webseiten Auslesen wie z.B. Wetter und diese in eine Datenbank schreiben.
Problem ich habe noch nie mit Python gearbeitet !!

Ich bin jezt so weit das ich Beautyfulsoup installieren will, mir aber nicht sicher bin ob es geklappt hat. Im Netz findet man zwar vieles aber das klappt alles nicht.

ich will nur als erstes mit dem Beautyfulsoup eine seite auslesen und daran scheitert es schon :roll:

Code: Alles auswählen

from bs4 import BeautifulSoup
import re

doc = ['<html><head><title>Page title</title></head>',
       '<body><p id="firstpara" align="center">This is paragraph <b>one</b>.',
       '<p id="secondpara" align="blah">This is paragraph <b>two</b>.',
       '</html>']
soup = BeautifulSoup(''.join(doc))

print soup.prettify()
raceback (most recent call last):
File "C:\Users\ASUS\Desktop\webcrawler.py", line 1, in <module>
from bs4 import BeautifulSoup
File "build\bdist.win-amd64\egg\bs4\__init__.py", line 30, in <module>
File "build\bdist.win-amd64\egg\bs4\builder\__init__.py", line 4, in <module>
File "build\bdist.win-amd64\egg\bs4\element.py", line 8, in <module>
File "build\bdist.win-amd64\egg\bs4\dammit.py", line 13, in <module>
ImportError: No module named html.entities


Kann mir einer Helfen?
Sirius3
User
Beiträge: 17711
Registriert: Sonntag 21. Oktober 2012, 17:20

@its-lange: um Beautifulsoup nutzen zu können, brauchst Du noch einen html-Parser, wie ihn z.B. lxml oder html5lib bietet.
its-lange
User
Beiträge: 3
Registriert: Dienstag 24. November 2015, 00:42

Klappt nicht :(
immer noch die gleiche Fehlermeldung

Wahrscheinlich ist die installation von BS nicht i.o wie löse ich denn das Problem?
kann mir einer eine Kurz anleitung auf deutsch geben ??
its-lange
User
Beiträge: 3
Registriert: Dienstag 24. November 2015, 00:42

Code: Alles auswählen

from BeautifulSoup import BeautifulSoup
import re
 
doc = ['<html><head><title>Page title</title></head>',
       '<body><p id="firstpara" align="center">This is paragraph <b>one</b>.',
       '<p id="secondpara" align="blah">This is paragraph <b>two</b>.',
       '</html>']
soup = BeautifulSoup(''.join(doc))
 
print soup.prettify(
jetzt passt es
BlackJack

@its-lange: Was für Versionen werden denn hier verwendet? `html.entities` ist ein Modul aus der Python Standardbibliothek in Python 3! Das *muss* also existieren wenn Python 3 verwendet wird und es existiert *nicht* in Python 2.
Antworten