Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
ich würde gerne - just for fun - die täglichen Schlagzeilen (Top Themen) von T-Online scrapen. Das Bild ist ansich kein Problem und funktioniert auch sehr gut ...
nur würde ich gerne auch die Schlagzeile selbst - die als Text darübergelegt wird - mit sichern. Hat vielleicht jemand eine Idee, wie man sowas lösen könnte?
Genau so wie du an dein Bild kommst. Schau dir im Browser an, welche Teile der Elemente zur eindeutigen Identifikation taugen und such dir diese raus. So ziemlich alle modernen Browser bieten mit einem Rechtsklick auf das Element die Option "Untersuchen" (oder ähnlich). Dann kannst du bequem mit durch die Elemente blättern.
Beispiel:
import requests
import bs4 as bs
soup = bs.BeautifulSoup(requests.get("http://www.t-online.de").content)
soup.find_all(class_="Tstage-text")[0].text
>>> '\n Neue Eiszeit mit den USA?\nHintervorgehaltenerHandbefürchtetEuropadasSchlimmsteVon Patrick Diekmann, New York '
Bilder sind nicht im HTML Code enthalten, sondern nur der Download-Link (src-Attribut des img-Tags). Mit der "requests" Library kannst du sie dann über den entsprechenden Link herunterladen.
den Text bzw. das Bild kann ich herunterladen.. das ist nicht das Problem! Ich suche aber nach einer Möglichkeit,
wie ich das Bild inkl. Schlagzeile als Bild speichern kann. Letztendlich wie es auf T-Online angezeigt wird.