Hallo Forum,
ich würde gerne - just for fun - die täglichen Schlagzeilen (Top Themen) von T-Online scrapen. Das Bild ist ansich kein Problem und funktioniert auch sehr gut ...
nur würde ich gerne auch die Schlagzeile selbst - die als Text darübergelegt wird - mit sichern. Hat vielleicht jemand eine Idee, wie man sowas lösen könnte?
Vielen Dank
Andi
Web Scraping / T-Online
-
- User
- Beiträge: 491
- Registriert: Mittwoch 13. November 2019, 08:38
Genau so wie du an dein Bild kommst. Schau dir im Browser an, welche Teile der Elemente zur eindeutigen Identifikation taugen und such dir diese raus. So ziemlich alle modernen Browser bieten mit einem Rechtsklick auf das Element die Option "Untersuchen" (oder ähnlich). Dann kannst du bequem mit durch die Elemente blättern.
Beispiel:
Beispiel:
Code: Alles auswählen
import requests
import bs4 as bs
soup = bs.BeautifulSoup(requests.get("http://www.t-online.de").content)
soup.find_all(class_="Tstage-text")[0].text
>>> '\n Neue Eiszeit mit den USA?\nHintervorgehaltenerHandbefürchtetEuropadasSchlimmsteVon Patrick Diekmann, New York '
Hallo,
den Text bzw. das Bild kann ich herunterladen.. das ist nicht das Problem! Ich suche aber nach einer Möglichkeit,
wie ich das Bild inkl. Schlagzeile als Bild speichern kann. Letztendlich wie es auf T-Online angezeigt wird.
Gruß, Andi.
den Text bzw. das Bild kann ich herunterladen.. das ist nicht das Problem! Ich suche aber nach einer Möglichkeit,
wie ich das Bild inkl. Schlagzeile als Bild speichern kann. Letztendlich wie es auf T-Online angezeigt wird.
Gruß, Andi.
Das geht nicht. Das ist per HTML darüber gelegt. Das so zusammen abzugreifen wird über requests niemals gehen.
Laut https://stackoverflow.com/questions/342 ... -webdriver könnte es mit selenium gehen.
Laut https://stackoverflow.com/questions/342 ... -webdriver könnte es mit selenium gehen.
@AndiS,
https://pillow.readthedocs.io/en/stable ... eDraw.text
Als wortwörtlich genommen, müsstest du eine Bildverarbeitslibrary verwenden um die Schlagzeile in das Bild einzufügen. Meinst du das?wie ich das Bild inkl. Schlagzeile als Bild speichern kann.
https://pillow.readthedocs.io/en/stable ... eDraw.text