Playlist lesen mit BeatfulSoup
Verfasst: Mittwoch 3. Januar 2018, 13:42
Hallo,
bin am Verzweifeln und bitte herzlich um einen Tip. Soup-Doku und googeln haben bisher nichts gebracht, mir fehlt der Ansatzpunkt.
Seiten Tagen versuche ich, mit bs4 die aktuell laufenden Songs einiger Sender für meine persönliche Informationsseite mittel BeautifulSoup 4 zu ermitteln. Während das für einige Sender (z.B. Klassik-Radio) problemlos gelingt, schaffe ich das für FluxFM z.B. nicht, obwohl ich die gewünschten Informationen im Quelltext der Seite (Inspektor von Firefox) sehen kann.
ich erhalte folgende Ausgabe:
<div id="playinfo-info">
<div id="playinfo-now">JETZT LÄUFT:</div>
<div id="playinfo-artist"></div>
<div id="playinfo-title"></div>
<div id="playinfo-desc"></div>
</div>
eigentlich sollten zwischen >< da Titel und Künstler im Klartext mit dabei sein.....
Hier ist mein Quelltext, ich wäre dankbar, wenn Ihr mal drauf sehen könntet, freue mich über jeden Hinweis VG Alex
bin am Verzweifeln und bitte herzlich um einen Tip. Soup-Doku und googeln haben bisher nichts gebracht, mir fehlt der Ansatzpunkt.
Seiten Tagen versuche ich, mit bs4 die aktuell laufenden Songs einiger Sender für meine persönliche Informationsseite mittel BeautifulSoup 4 zu ermitteln. Während das für einige Sender (z.B. Klassik-Radio) problemlos gelingt, schaffe ich das für FluxFM z.B. nicht, obwohl ich die gewünschten Informationen im Quelltext der Seite (Inspektor von Firefox) sehen kann.
ich erhalte folgende Ausgabe:
<div id="playinfo-info">
<div id="playinfo-now">JETZT LÄUFT:</div>
<div id="playinfo-artist"></div>
<div id="playinfo-title"></div>
<div id="playinfo-desc"></div>
</div>
eigentlich sollten zwischen >< da Titel und Künstler im Klartext mit dabei sein.....
Hier ist mein Quelltext, ich wäre dankbar, wenn Ihr mal drauf sehen könntet, freue mich über jeden Hinweis VG Alex
Code: Alles auswählen
from bs4 import BeautifulSoup
import urllib
import html5lib
r = urllib.request.urlopen('https://www.fluxfm.de/playlist/')
soup = BeautifulSoup(r, "html5lib")
print (soup.prettify()[0:16000])
resultlist = soup.find_all("div", {'id': 'playinfo-info'})
print(len(resultlist))
ergebnis = 0
i = 0
while i < len(resultlist):
print(resultlist[i])
i = i + 1