Die Suche ergab 354 Treffer

von egon11
Montag 13. Januar 2020, 20:26
Forum: Allgemeine Fragen
Thema: Html Seite einlesen
Antworten: 97
Zugriffe: 8060

Re: Html Seite einlesen

Vielen dank für die große Hilfe, jetzt kann ich damit weiter arbeiten.
von egon11
Montag 13. Januar 2020, 18:48
Forum: Allgemeine Fragen
Thema: Html Seite einlesen
Antworten: 97
Zugriffe: 8060

Re: Html Seite einlesen

Hat keiner ein Schema für mich? Ich komme absolut nicht weiter wie der "Suchbaum" aussehen muss.
Ich wäre dankbar.
von egon11
Montag 13. Januar 2020, 14:04
Forum: Allgemeine Fragen
Thema: Html Seite einlesen
Antworten: 97
Zugriffe: 8060

Re: Html Seite einlesen

Wo hast Du ein Problem, den header zusammen mit den match`s auch noch zu suchen, innerhalb von sdc-site-fixres-box? Ja genau. Ich habe schon Stunden versucht, das ganze zu Parsen, mit "for" und was weiß ich. Letztendlich bekam ich es nicht hin. Ziel sollte sein Die Tages Ansetzung, dann d...
von egon11
Montag 13. Januar 2020, 13:46
Forum: Allgemeine Fragen
Thema: Html Seite einlesen
Antworten: 97
Zugriffe: 8060

Re: Html Seite einlesen

Jetzt habe ich die Spielpaarungen so wie ich es haben möchte, was mir noch fehlt sind die Tages Ansetzungen "<h4 class="sdc-site-fixres__header2">Freitag, 17. Januar</h4>". Hat jemand eine Idee wie ich die Tages Ansetzungen an der richtigen Stelle mit einfügen kann? #!/usr/bin/py...
von egon11
Montag 13. Januar 2020, 11:47
Forum: Allgemeine Fragen
Thema: Html Seite einlesen
Antworten: 97
Zugriffe: 8060

Re: Html Seite einlesen

OK, ich werde es ändern. Mir fehlt jetzt noch das löschen von bestimmten tags, wie kann ich z.b. eine Klasse löschen? Ich habe mir clear angeschaut. Aber so richtig nicht schlau geworden. Ich möchte das "data-label-abandoned="X">0</span>" im Text entfernen. <div class="sdc-s...
von egon11
Sonntag 12. Januar 2020, 19:13
Forum: Allgemeine Fragen
Thema: Html Seite einlesen
Antworten: 97
Zugriffe: 8060

Re: Html Seite einlesen

Habe es jetzt abgeändert. trotzdem noch sehr unzufrieden. def begegnung(): url = "https://sport.sky.de/bundesliga-spielplan-ergebnisse" response = requests.get(url) html = BeautifulSoup(response.text, 'lxml') liste = [] for spiel in html.find_all(class_="sdc-site-fixres__match"):...
von egon11
Sonntag 12. Januar 2020, 18:49
Forum: Allgemeine Fragen
Thema: Html Seite einlesen
Antworten: 97
Zugriffe: 8060

Re: Html Seite einlesen

Warum ist der Ansatz falsch: def begegnung(): url = "https://sport.sky.de/bundesliga-spielplan-ergebnisse" response = requests.get(url) html = BeautifulSoup(response.text, 'lxml') liste = [] alles = "" for text in html.find_all(class_="sdc-site-fixres-wrap"): for i in t...
von egon11
Sonntag 12. Januar 2020, 13:31
Forum: Allgemeine Fragen
Thema: Html Seite einlesen
Antworten: 97
Zugriffe: 8060

Re: Html Seite einlesen

#!/usr/bin/python # -*- coding: utf-8 -*- import requests from bs4 import BeautifulSoup def begegnung(): url = "https://sport.sky.de/bundesliga-spielplan-ergebnisse" response = requests.get(url) html = BeautifulSoup(response.text, 'lxml') for klasse in html.find_all(class_="sdc-site-...
von egon11
Sonntag 12. Januar 2020, 12:49
Forum: Allgemeine Fragen
Thema: Html Seite einlesen
Antworten: 97
Zugriffe: 8060

Re: Html Seite einlesen

Damit wird doch die Klassen gemeint oder? Habe es jetzt mal durchgetestet, aber entweder habe ich nur Vereine oder alles andere, ich dachte man kann es wie in der Tabelle mit einer Liste machen und anschließend verarbeiten.
von egon11
Sonntag 12. Januar 2020, 11:46
Forum: Allgemeine Fragen
Thema: Html Seite einlesen
Antworten: 97
Zugriffe: 8060

Re: Html Seite einlesen

Die Seite habe ich dann gefunden und für Tabellen sehr gut geeignet. Die soll auch genutzt werden entgültig.
OK ich suche mal nach Dom-Tree.
von egon11
Sonntag 12. Januar 2020, 09:58
Forum: Allgemeine Fragen
Thema: Html Seite einlesen
Antworten: 97
Zugriffe: 8060

Re: Html Seite einlesen

Ich habe es wieder raus genommen. Es läuft,. Danke. Nur ich verzweifle jetzt an einer Stelle, möchte mir die Ergebnisse anzeigen lassen, aber egal wie ich es filtere kommt nur Müll raus. Hier mein code: #!/usr/bin/python ### -*- coding: utf-8 -*- import requests from bs4 import BeautifulSoup def beg...
von egon11
Dienstag 7. Januar 2020, 13:54
Forum: Allgemeine Fragen
Thema: Html Seite einlesen
Antworten: 97
Zugriffe: 8060

Re: Html Seite einlesen

Jetzt funktioniert es so wie es soll mit `lxml`.

Vielen Dank an alle.
von egon11
Dienstag 7. Januar 2020, 11:33
Forum: Allgemeine Fragen
Thema: Html Seite einlesen
Antworten: 97
Zugriffe: 8060

Re: Html Seite einlesen

@Sirius3: Das hat funktioniert, jetzt geht es auch auf der konsole. Nur ich kann dieses Plugin nicht öffnen, obwohl ich `lxml` installiert habe. 11:24:42.9942 { } /usr/lib/python2.7/site-packages/twisted/python/util.py:815 untilConcludes 2020-01-07 11:24:42+0100 [-] FeatureNotFound: Couldn't find a ...
von egon11
Dienstag 7. Januar 2020, 10:21
Forum: Allgemeine Fragen
Thema: Html Seite einlesen
Antworten: 97
Zugriffe: 8060

Re: Html Seite einlesen

@egon11: Wie gesagt, an der Stelle sollte man dann "lxml" statt "html.parser" nehmen. Da fangen schon die nächsten Probleme an. Wenn ich es über IDLE ausführe geht es, allerdings nicht über Konsole, da wird mir Traceback (most recent call last): File "/home/prob.py", l...
von egon11
Dienstag 7. Januar 2020, 09:14
Forum: Allgemeine Fragen
Thema: Html Seite einlesen
Antworten: 97
Zugriffe: 8060

Re: Html Seite einlesen

Jetzt habe ich getestet, an dieser Stelle dauert es ziemlich lange:

Code: Alles auswählen

BeautifulSoup(response.content, 'html.parser')
von egon11
Sonntag 5. Januar 2020, 19:57
Forum: Allgemeine Fragen
Thema: Html Seite einlesen
Antworten: 97
Zugriffe: 8060

Re: Html Seite einlesen

BeautifulSoup mit "lxml"
von egon11
Sonntag 5. Januar 2020, 19:36
Forum: Allgemeine Fragen
Thema: Html Seite einlesen
Antworten: 97
Zugriffe: 8060

Re: Html Seite einlesen

@__blackjack__ : OK ich schaue mal nach.

Wenn ich "BeautifulSoup(response.content, 'lxml')" nehme, gibt es da eine Doku?
von egon11
Sonntag 5. Januar 2020, 18:45
Forum: Allgemeine Fragen
Thema: Html Seite einlesen
Antworten: 97
Zugriffe: 8060

Re: Html Seite einlesen

Das Problem ist, es gab mal das "kicker" plugin. Somit konnte man aktuelle Ergebnisse etc. abrufen. Wenn man da auf eine Seite ging dauerte es nicht lang und die wurde geladen. Wenn ich jetzt mein Plugin öffne, dauert es knapp 7 Sekunden, bis die Seite geladen hat. Und das auf einer 1,6GHZ...
von egon11
Sonntag 5. Januar 2020, 17:54
Forum: Allgemeine Fragen
Thema: Html Seite einlesen
Antworten: 97
Zugriffe: 8060

Re: Html Seite einlesen

Ich habe mir gerade gelesen dass das Modul "lxml" schneller als bs4 arbeiten soll.
Kann man daraus etwas basteln was ich vor hab?
Wenn ja ich finde dazu kein richtiges howto im Netz, eventuell jemand einen Tipp?
von egon11
Sonntag 5. Januar 2020, 12:37
Forum: Allgemeine Fragen
Thema: Html Seite einlesen
Antworten: 97
Zugriffe: 8060

Re: Html Seite einlesen

Das encode habe ich wieder raus genommen. so sieht meine print Ausgabe aus: Pl Verein Sp G UE V Tore Diff P None None None None None None None None None None None None None None None None None None None None None None None None None None None None None None None None None None None None None None No...