Dynamische Webseite parsen.

Schlangenmensch · Donnerstag 27. Juni 2024, 08:06

Guten Morgen,

auch wenn ich hier vermutlich nicht im richtigen Thread bin, wollte ich Euch kurz um Hilfe bitten.

Ich würde von einer Seite gerne täglich den Kurs von einem Aktien-Fond abrufen und in einer Tabelle speichern.

Da mir HTML noch fremder ist als phyton, wollte ich kurz fragen, ob es mit folgendem Code überhaupt möglich ist den dynamischen Wert auszulesen bzw. welche "HTML-Tags" ich verwenden müsste um an die Informationen heranzukommen.

Code: Alles auswählen

import requests
from bs4 import BeautifulSoup

URL = 'https://www.boerse-frankfurt.de/fonds/meag-fairreturn'

response = requests.get(URL)
#print(response.text)

soup = BeautifulSoup(response.text, 'html.parser')
kurs_data = soup.find('span', {'attribut-name': '_ngcontent-boerse-frankfurt-c135'})

print(kurs_data)

__blackjack__ · Donnerstag 27. Juni 2024, 08:30

@Schlangenmensch: Das hängt vom konkreten HTML ab in welchen Tags die Informationen stecken die Du haben möchtest. Und neben HTML und CSS braucht man hier auch ein Verständnis von HTTP und eventuell ein bisschen JavaScript, denn bei der URL im Quelltext kommen erst einmal gar keine Daten. Die werden wohl dynamisch mit JavaScript nachgeladen. Da müsste man schauen in welchem Format und woher.

Schlangenmensch · Donnerstag 27. Juni 2024, 09:02

Vielen Dank für die Antwort.

Ich habe bereits befürchtet, dass es nicht so einfach sein wird wie in einem Tutorial beschrieben wird.

In der Zwischenzeit bin ich auf das Modul "selenium" gestossen, welches Java-Scripte ausführt und sich in python verwenden lassen soll.

Wird wohl viel Arbeit für mich bis ich mich da einigermaßen herangetastet habe.

Schönen Tag noch.

Kebap · Donnerstag 27. Juni 2024, 10:10

Üblicherweise muss sich dafür nicht jeder Leser selbst ein Programm schreiben, das die Webseiten kompliziert ausliest.
Sondern der Betreiber der Webseite bietet die Daten außerdem maschinenlesbar über eine API an, ggf. kostenpflichtig.
Andere Betreiber wollen die Daten vielleicht gar nicht bereitstellen und wehren sich sogar aktiv gegen Auslesen der Webseiten.
Bei der Börse sehe ich aber eine API und sie schreiben sogar, dass manche Funktionen kostenlos direkt nach Registrierung vorliegen:
https://www.deutsche-boerse.com/dbg-de/ ... i-platform
Also hier musst du dich nicht mit HTTP, HTML, CSS; Java Script, usw. herumschlagen, sondern "nur" mit dem normalen Robot Trading.

einfachTobi · Donnerstag 27. Juni 2024, 12:31

Wenn es darum geht Börsendaten auszulesen, ist sicherlich auch yfinance einen Blick wert. Damit erhältst du deine Daten mit wenigen Zeilen Code und musst dich nicht selbst um die Website kümmern.

Schlangenmensch · Freitag 28. Juni 2024, 07:28

Leider erhalte ich von Yfiinance je nach Produkt nur Daten bis 2014, selbst nachdem ich yfinance upgedatet habe (Version "....2022")

Ich werde mir dann wohl doch den anderen Weg ansehen.

Vielen Dank füe Euere Antworten.

einfachTobi · Freitag 28. Juni 2024, 07:38

Schlangenmensch hat geschrieben: Donnerstag 27. Juni 2024, 08:06 Ich würde von einer Seite gerne täglich den Kurs von einem Aktien-Fond abrufen und in einer Tabelle speichern.

Gemäß dieser Anforderung reicht dir doch ein Tag aus. Du rufst den jeweiligen Kurs täglich ab, speicherst ihn und fertig.

Schlangenmensch · Samstag 29. Juni 2024, 09:39

Leider erhalte ich immer die Fehlermeldung: ['A0RFJW.DE']: YFPricesMissingError('$%ticker%: possibly delisted; No price data found (1d 2024-06-01 -> 2024-06-02)'). Wenn ich das Jahr in 2016 ändere, funktioniert es einwandfrei.

Deshalb meine Vermutung, dass yfinance nicht mehr aktuell gehalten wird.

Code: Alles auswählen

import yfinance as yf

data = yf.download("A0RFJW.DE", start="2024-06-03", end="2024-06-04")


print(data)

__blackjack__ · Samstag 29. Juni 2024, 10:13

@Schlangenmensch: Über das `Ticker`-Objekt kommt auf die Daten die auch auf der Webseite angezeigt werden.