Reinforcement Learning als Optimizer verwenden

mit matplotlib, NumPy, pandas, SciPy, SymPy und weiteren mathematischen Programmbibliotheken.
Antworten
servus_97
User
Beiträge: 24
Registriert: Donnerstag 3. September 2020, 12:01

Hallo liebe Community,

aktuell habe ich Interesse in RL entwickelt und bin sehr fasziniert von den Möglichkeiten :)
Jetzt habe ich mich mal ein wenig gewagt und ein eigenes Projekt gestartet.

Die Problematik:

Habe ich eine Schaltung und die Schaltung wird n mal durchlaufen. (Sei n=1000)
Und nach jedem Durchlauf bekomme ich immer ein Wert (int) , die Aufgabe besteht jetzt anhand des Wertes , Winkel (alpha, beta) von der Schaltung zu optimieren.
Diese Winkel (init angles) werden als Input für die Optimierung genommen und auch in der Schaltung.

ALSO:
Als Input habe ich :
1) Int Wert
2) init angles
3) Schranke für die Winkeln bspw np.array([[0.0, np.pi], [0.0, np.pi*2]]*n )
4) n

Muss ich da in RL jetzt eine komplette Umgebung programmieren und was wären da meine Ansätze :/
Bin für jegliche Hilfe sprich Ansatz extrem dankbar :D

LG
Benutzeravatar
ThomasL
User
Beiträge: 1366
Registriert: Montag 14. Mai 2018, 14:44
Wohnort: Kreis Unna NRW

Ich bin Pazifist und greife niemanden an, auch nicht mit Worten.
Für alle meine Code Beispiele gilt: "There is always a better way."
https://projecteuler.net/profile/Brotherluii.png
servus_97
User
Beiträge: 24
Registriert: Donnerstag 3. September 2020, 12:01

Danke, schaue ich mir gleich mal an :)
Antworten