Chart Pattern Erkennung mit Python & PyTorch
Verfasst: Mittwoch 9. Februar 2022, 17:48
Hallo zusammen,
ich bin neu auf diesem Forum, deshalb verzeiht mir wenn ich eine Frage stelle, die bereits beantwortet wurde.
Kurz zu mir: Ich programmiere mittlerweile 1,5 Jahre in Python (davor nur C++) und kenne mich mit den Grundlagen ganz gut aus. Mit PyTorch arbeite ich seit 2 Monaten.
Ich möchte mit PyTorch (also allg. Neuronalen Netzen) sog. Continuitation Patterns (Erklärung: https://www.investopedia.com/trading/co ... roduction/) in Financial Data finden. Mein großes Ziel wäre es, dass ein Tensor bestehend aus n vielen
Zeit-Kurs-Daten (im OHLC-Format, dh. Candlestickformat) dem Netz übergeben wird und dann zwischen potentiellen Patterns (insgesamt ca. 5) klassifiziert wird.
Nun meine Frage: Wie genau soll ich das Netz trainieren und validieren? Damit eine akzeptierbare accuracy erreicht wird, wären doch pro Pattern mind. 100 Trainingsbeispiele erforderlich, dh. insgesamt mind. 500 Trainingsdatensätze. Das Problem an diesen Patterns ist ja, dass innerhalb ein und derselben Klasse große Unterschiede vorkommen. Gibt es solche gelabelten Chart Patterns als Trainingsdaten im Internet, wenn ja: wo? Diese Trainingsdaten manuell zu erstellen würde Tage dauern, da ich ja durch den Historiekurs der gewünschten Aktie/Krypto scrollen müsste um mir dann die Zeitintervalle zu notieren.
Wie würdet ihr vorgehen?
Viele Grüße und vorab vielen Dank,
jonathan108
ich bin neu auf diesem Forum, deshalb verzeiht mir wenn ich eine Frage stelle, die bereits beantwortet wurde.
Kurz zu mir: Ich programmiere mittlerweile 1,5 Jahre in Python (davor nur C++) und kenne mich mit den Grundlagen ganz gut aus. Mit PyTorch arbeite ich seit 2 Monaten.
Ich möchte mit PyTorch (also allg. Neuronalen Netzen) sog. Continuitation Patterns (Erklärung: https://www.investopedia.com/trading/co ... roduction/) in Financial Data finden. Mein großes Ziel wäre es, dass ein Tensor bestehend aus n vielen
Zeit-Kurs-Daten (im OHLC-Format, dh. Candlestickformat) dem Netz übergeben wird und dann zwischen potentiellen Patterns (insgesamt ca. 5) klassifiziert wird.
Nun meine Frage: Wie genau soll ich das Netz trainieren und validieren? Damit eine akzeptierbare accuracy erreicht wird, wären doch pro Pattern mind. 100 Trainingsbeispiele erforderlich, dh. insgesamt mind. 500 Trainingsdatensätze. Das Problem an diesen Patterns ist ja, dass innerhalb ein und derselben Klasse große Unterschiede vorkommen. Gibt es solche gelabelten Chart Patterns als Trainingsdaten im Internet, wenn ja: wo? Diese Trainingsdaten manuell zu erstellen würde Tage dauern, da ich ja durch den Historiekurs der gewünschten Aktie/Krypto scrollen müsste um mir dann die Zeitintervalle zu notieren.
Wie würdet ihr vorgehen?
Viele Grüße und vorab vielen Dank,
jonathan108