ich habe aktuell ein Problem und komme leider nicht weiter, bin im Umgang mit python noch sehr grün hinter den Ohren.
Ich versuche aktuell die Korrelation der Schlusskurse vom DAX & SP500 seit 2000 zu berechnen. Diese habe ich in zwei unterschiedlichen csv-Dateien gespeichert. Im Folgenden mal mein Code:
Code: Alles auswählen
import pandas as pd
import numpy as np
from scipy.stats.stats import pearsonr
data_file1 = 'DAX30.csv'
data_file2 = 'SP500.csv'
# read data from csv
df1 = pd.read_csv(data_file1, parse_dates=True, index_col=0)
df2 = pd.read_csv(data_file2, parse_dates=True, index_col=0)
cor1 = np.corrcoef(df1['Adj Close'], df2['Adj Close'])[0,1]
cor2 = pearsonr(df1['Adj Close'], df2['Adj Close'])
Bei corrcoef() erhalte ich folgende Fehlermeldung:
ValueError: all the input array dimensions except for the concatenation axis must match exactly
und bei pearsonr() diese:
ValueError: operands could not be broadcast together with shapes (4361,) (4305,)
Ich verstehe, dass meine Daten offensichtlich nicht genau zusammen passen. Ich habe bereits versucht über .shape() oder .reshape() meine Daten zu shapen, aber leider gelingt mir das nicht. Wie genau schaffe ich es nun die Daten für meine Korrelationsberechnung verfügbar zu machen?
Ich freue mich über jeglichen Input.
Lg Yannik