ich arbeite an einem Projekt für meine Uni und komme nicht weiter. Ich möchte ein Machine learning Model (SVM) schreiben welches den Wärmeverbrauch vorhersagt dazu habe ich mehre Datensätze (in .csv format). Ein Datensatz ist jeweils der Wärmeverbrauch von einem Haus über das gesamte Jahr 2023, diese Datei muss ich mit einer Excel Datei verbinden um die dazugehörigen Außentemperaturen ins Model einzubinden. Nun läuft die SVM und das ist auch alles gut, allerdings nur für eine Datei. Soviel zur Erklärung jetzt die Frage:
Ich habe ein Ordner wo alle 3500 csv Datein sind, davon sollen jetzt davon sollen 100 random ausgewählt werden die Vorhersage gemacht werden und anschließend die vorhergesagten Daten gespeichert und der Durchschnitt gebildet werden und anschließend hochgerechnet.
Ich weiß allerdings nicht mit welchen Code man das machen soll oder in welchem Punkt der Aufgestellt werden muss?
Ich wäre jeden über hilfe dankbar
Ich sollte dazu noch sagen ich bin noch sehr neu mit dem Programmieren daher bräuchte ich eine möglichst genau Erklärung.
Vielen Dank im Voraus!
