Boese-online GUV auslesen

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
incoggnito
User
Beiträge: 53
Registriert: Donnerstag 27. April 2017, 09:28

Hallo Zusammen,

man sagte mir ich soll mich mal mit Aktien befassen ... :twisted:
Da ich mir ein paar Anlage-Strategien angesehen habe, würde ich nun gerne die online vorhandenen Daten nach meinen Kriterien filtern.
Denke mal ich bin nicht der erste der auf eine solche Idee kommt... :mrgreen:

Als Beispiel habe ich mir die Website von http://www.boerse-online.de/bilanz_guv/Infineon gesucht.
Die Tabellen im G+V lassen sich wunderbar in Dataframes ziehen und dann weiterverarbeiten (das funktioniert schonmal).

Sieht man sich die Linkstruktur an, hätte ich als Laie nun gerne alle Files (bzw. alle Wertpapiere mit GuV) aus diesem Unterordner abgegriffen
"http://www.boerse-online.de/bilanz_guv/"
Vermutlich geht das nicht so einfach, oder?
Wie würdet ihr an diese Problemstellung rangehen?

Viele Grüße
Inco
__deets__
User
Beiträge: 14529
Registriert: Mittwoch 14. Oktober 2015, 14:29

Zeig uns bitte deine Daten, und deinen Code. Dann kann man da helfen.
incoggnito
User
Beiträge: 53
Registriert: Donnerstag 27. April 2017, 09:28

Code wäre erstmal nur sowas:

Code: Alles auswählen

import requests
import pandas as pd

# verwendete Namen der Aktien auf der Website
Aktienname = #???

#aufrufen einer GuV Aktie
url = 'http://www.boerse-online.de/bilanz_guv/' + Aktienname

#auslesen HTML code
html = requests.get(url).content

#Listen identifizieren und zusammenfassen
df_list = pd.read_html(html)
df = df_list[-1]

#Weitere Verarbeitung der dataframes in numpy ....
Mir fehlt der Weg zu den Aktiennamen.
Kann man alle vorhandenen Eintrag hinter dem Slash auf einer Websiter ermitteln. (wie in einer lokalen filestruktur)
Oder muss man ein Programm schreiben, dass hier alle Möglichkeiten (Links) durchgeht um die Aktiennamen zu finden.

Viele Grüße
Inco
Sirius3
User
Beiträge: 17741
Registriert: Sonntag 21. Oktober 2012, 17:20

@incoggnito: nein, es gibt keine Möglichkeit, alle Aktiennamen zu ermitteln, wenn das die Webseite nicht vorsieht.
incoggnito
User
Beiträge: 53
Registriert: Donnerstag 27. April 2017, 09:28

ok, dann mache ich das über Anfragen auf den Suchindex der Seite.
Hier kann ich von a-z alle Werte abfragen und aus den Linknamen den Aktiennamen extrahieren.
Dann muss ich nur noch prüfen ob für die Aktie die erforderlichen Daten hinterlegt sind.

Viele Grüße
Inco
gotridofmyphone
User
Beiträge: 33
Registriert: Mittwoch 15. März 2017, 08:54

Bevor du hier beginnst, exzessiv boerse-online zu scrapen, solltest du zumindest mal einen Blick in die AGB werfen und nach Regelungen suchen, die das automatische Einlesen und Verarbeiten verbieten. Besonders dann, wenn du dein Skript kommerziell verwerten willst. Nur damit du dich nicht wunderst, wenn dein Tun Konsequenzen hat.
Bolitho
User
Beiträge: 219
Registriert: Donnerstag 21. Juli 2011, 07:01
Wohnort: Stade / Hamburg
Kontaktdaten:

du kannst dir auch mal ariva.de ansehen, dort kannst du zumindest mit der WKN im Link arbeiten und eine Liste z.B. der DAX WKNs sollte irgendwo verfügbar sein.

Für amerikanische Unternehmen ist das deutlich leichter, dann aber eben auch deren Geschäftsberichte.

Auf divipedia.de habe ich ein bißchen was gebastelt (alles Django, Python) - bei speziellen Fragen, melde dich gerne.
Antworten