Hallo Zusammen,
man sagte mir ich soll mich mal mit Aktien befassen ...
Da ich mir ein paar Anlage-Strategien angesehen habe, würde ich nun gerne die online vorhandenen Daten nach meinen Kriterien filtern.
Denke mal ich bin nicht der erste der auf eine solche Idee kommt...
Als Beispiel habe ich mir die Website von http://www.boerse-online.de/bilanz_guv/Infineon gesucht.
Die Tabellen im G+V lassen sich wunderbar in Dataframes ziehen und dann weiterverarbeiten (das funktioniert schonmal).
Sieht man sich die Linkstruktur an, hätte ich als Laie nun gerne alle Files (bzw. alle Wertpapiere mit GuV) aus diesem Unterordner abgegriffen
"http://www.boerse-online.de/bilanz_guv/"
Vermutlich geht das nicht so einfach, oder?
Wie würdet ihr an diese Problemstellung rangehen?
Viele Grüße
Inco
Boese-online GUV auslesen
-
- User
- Beiträge: 53
- Registriert: Donnerstag 27. April 2017, 09:28
Code wäre erstmal nur sowas:
Mir fehlt der Weg zu den Aktiennamen.
Kann man alle vorhandenen Eintrag hinter dem Slash auf einer Websiter ermitteln. (wie in einer lokalen filestruktur)
Oder muss man ein Programm schreiben, dass hier alle Möglichkeiten (Links) durchgeht um die Aktiennamen zu finden.
Viele Grüße
Inco
Code: Alles auswählen
import requests
import pandas as pd
# verwendete Namen der Aktien auf der Website
Aktienname = #???
#aufrufen einer GuV Aktie
url = 'http://www.boerse-online.de/bilanz_guv/' + Aktienname
#auslesen HTML code
html = requests.get(url).content
#Listen identifizieren und zusammenfassen
df_list = pd.read_html(html)
df = df_list[-1]
#Weitere Verarbeitung der dataframes in numpy ....
Kann man alle vorhandenen Eintrag hinter dem Slash auf einer Websiter ermitteln. (wie in einer lokalen filestruktur)
Oder muss man ein Programm schreiben, dass hier alle Möglichkeiten (Links) durchgeht um die Aktiennamen zu finden.
Viele Grüße
Inco
-
- User
- Beiträge: 53
- Registriert: Donnerstag 27. April 2017, 09:28
ok, dann mache ich das über Anfragen auf den Suchindex der Seite.
Hier kann ich von a-z alle Werte abfragen und aus den Linknamen den Aktiennamen extrahieren.
Dann muss ich nur noch prüfen ob für die Aktie die erforderlichen Daten hinterlegt sind.
Viele Grüße
Inco
Hier kann ich von a-z alle Werte abfragen und aus den Linknamen den Aktiennamen extrahieren.
Dann muss ich nur noch prüfen ob für die Aktie die erforderlichen Daten hinterlegt sind.
Viele Grüße
Inco
-
- User
- Beiträge: 33
- Registriert: Mittwoch 15. März 2017, 08:54
Bevor du hier beginnst, exzessiv boerse-online zu scrapen, solltest du zumindest mal einen Blick in die AGB werfen und nach Regelungen suchen, die das automatische Einlesen und Verarbeiten verbieten. Besonders dann, wenn du dein Skript kommerziell verwerten willst. Nur damit du dich nicht wunderst, wenn dein Tun Konsequenzen hat.
-
- User
- Beiträge: 219
- Registriert: Donnerstag 21. Juli 2011, 07:01
- Wohnort: Stade / Hamburg
- Kontaktdaten:
du kannst dir auch mal ariva.de ansehen, dort kannst du zumindest mit der WKN im Link arbeiten und eine Liste z.B. der DAX WKNs sollte irgendwo verfügbar sein.
Für amerikanische Unternehmen ist das deutlich leichter, dann aber eben auch deren Geschäftsberichte.
Auf divipedia.de habe ich ein bißchen was gebastelt (alles Django, Python) - bei speziellen Fragen, melde dich gerne.
Für amerikanische Unternehmen ist das deutlich leichter, dann aber eben auch deren Geschäftsberichte.
Auf divipedia.de habe ich ein bißchen was gebastelt (alles Django, Python) - bei speziellen Fragen, melde dich gerne.