Hallo,
ich habe einen gecrawlten csv-Datensatz in Python eingelesen mit folgenden Spalten: Unternehmen (10 verschiedene), Quelle, Artikeldatum, Risiko etc. -> das funktioniert. Der Code dazu:
df = pd.read_csv('file', sep = '|', error_bad_lines=False, engine='python')
Das sind die Spalten: print(df.columns)
Index(['Unnamed: 0', 'company_name', 'source_name', 'scraping_datetime',
'article_url', 'article_datetime', 'article_title', 'article_text',
'risk', 'article_text_clean',
'article_text_stemmed;;;;;;;;;;;;;;;;;;;;;;;'],
dtype='object')
Meine Aufgabe:
Ich möchte die Aktienkurse aus yahoo.finance von diesen Unternehmen (Spalte: Company_name) am Erscheinungsdatum des Artikels (Spalte: article_datetime) verbinden. Die Aktienkurse sollen genau dem Erscheinungsdatum des Artikels entsprechen. Um Sentiment Analysis anzuwenden, brauche ich die nächsten 3 Aktienkurs-Tage nach dem Erscheinungsdatum, um die Veränderung in Prozent aufzuzeigen, entweder positiv oder negativ.
Ich weiß, dass ich eine Funktion schreiben muss mit def und return %, aber wie gehe ich da vor?
Ich wäre für eine Idee, Vorschlag, Tipp sehr dankbar.
VG
Hope