Seite 1 von 1

Boese-online GUV auslesen

Verfasst: Dienstag 27. März 2018, 16:24
von incoggnito
Hallo Zusammen,

man sagte mir ich soll mich mal mit Aktien befassen ... :twisted:
Da ich mir ein paar Anlage-Strategien angesehen habe, würde ich nun gerne die online vorhandenen Daten nach meinen Kriterien filtern.
Denke mal ich bin nicht der erste der auf eine solche Idee kommt... :mrgreen:

Als Beispiel habe ich mir die Website von http://www.boerse-online.de/bilanz_guv/Infineon gesucht.
Die Tabellen im G+V lassen sich wunderbar in Dataframes ziehen und dann weiterverarbeiten (das funktioniert schonmal).

Sieht man sich die Linkstruktur an, hätte ich als Laie nun gerne alle Files (bzw. alle Wertpapiere mit GuV) aus diesem Unterordner abgegriffen
"http://www.boerse-online.de/bilanz_guv/"
Vermutlich geht das nicht so einfach, oder?
Wie würdet ihr an diese Problemstellung rangehen?

Viele Grüße
Inco

Re: Boese-online GUV auslesen

Verfasst: Dienstag 27. März 2018, 16:39
von __deets__
Zeig uns bitte deine Daten, und deinen Code. Dann kann man da helfen.

Re: Boese-online GUV auslesen

Verfasst: Dienstag 27. März 2018, 21:55
von incoggnito
Code wäre erstmal nur sowas:

Code: Alles auswählen

import requests
import pandas as pd

# verwendete Namen der Aktien auf der Website
Aktienname = #???

#aufrufen einer GuV Aktie
url = 'http://www.boerse-online.de/bilanz_guv/' + Aktienname

#auslesen HTML code
html = requests.get(url).content

#Listen identifizieren und zusammenfassen
df_list = pd.read_html(html)
df = df_list[-1]

#Weitere Verarbeitung der dataframes in numpy ....
Mir fehlt der Weg zu den Aktiennamen.
Kann man alle vorhandenen Eintrag hinter dem Slash auf einer Websiter ermitteln. (wie in einer lokalen filestruktur)
Oder muss man ein Programm schreiben, dass hier alle Möglichkeiten (Links) durchgeht um die Aktiennamen zu finden.

Viele Grüße
Inco

Re: Boese-online GUV auslesen

Verfasst: Dienstag 27. März 2018, 22:09
von Sirius3
@incoggnito: nein, es gibt keine Möglichkeit, alle Aktiennamen zu ermitteln, wenn das die Webseite nicht vorsieht.

Re: Boese-online GUV auslesen

Verfasst: Dienstag 27. März 2018, 22:28
von incoggnito
ok, dann mache ich das über Anfragen auf den Suchindex der Seite.
Hier kann ich von a-z alle Werte abfragen und aus den Linknamen den Aktiennamen extrahieren.
Dann muss ich nur noch prüfen ob für die Aktie die erforderlichen Daten hinterlegt sind.

Viele Grüße
Inco

Re: Boese-online GUV auslesen

Verfasst: Mittwoch 28. März 2018, 12:10
von gotridofmyphone
Bevor du hier beginnst, exzessiv boerse-online zu scrapen, solltest du zumindest mal einen Blick in die AGB werfen und nach Regelungen suchen, die das automatische Einlesen und Verarbeiten verbieten. Besonders dann, wenn du dein Skript kommerziell verwerten willst. Nur damit du dich nicht wunderst, wenn dein Tun Konsequenzen hat.

Re: Boese-online GUV auslesen

Verfasst: Donnerstag 29. März 2018, 07:35
von Bolitho
du kannst dir auch mal ariva.de ansehen, dort kannst du zumindest mit der WKN im Link arbeiten und eine Liste z.B. der DAX WKNs sollte irgendwo verfügbar sein.

Für amerikanische Unternehmen ist das deutlich leichter, dann aber eben auch deren Geschäftsberichte.

Auf divipedia.de habe ich ein bißchen was gebastelt (alles Django, Python) - bei speziellen Fragen, melde dich gerne.