Separater Validation set unnötig duch cross_validation_score?

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
nichtSoGuter
User
Beiträge: 92
Registriert: Mittwoch 13. April 2022, 17:40

Ist ein seperater valdiation set neben dem train und dem test set unnötig, wenn man cross_validation_score von sklearn verwendet? Dabei wird ja sowieso ein teil des train sets ausgelassen für die evaluation.
Wozu nützt dann das validation set?
Benutzeravatar
ThomasL
User
Beiträge: 1366
Registriert: Montag 14. Mai 2018, 14:44
Wohnort: Kreis Unna NRW

Schau mal hier rein: https://stephenallwright.com/cross_validate-sklearn/

Was mir da nicht gefällt, ist das er in der ersten Grafik den Begriff Testdata verwendet. Das ist falsch. Es müsste Validation Data heißen.

Cross Validation wird auf die Traningsdaten angewendet. Wenn die daraus resultierende Genauigkeit, nach Justage der Trainingsparameter, ok ist,
wird immer abschließend auf die zuvor von der Gesamtheit der vorliegenden Daten abgetrennten Testdaten einmalig validiert.
Die daraus resultierende Genauigkeit ist die einzig relevante Maßeinheit für das Modell.
Ich bin Pazifist und greife niemanden an, auch nicht mit Worten.
Für alle meine Code Beispiele gilt: "There is always a better way."
https://projecteuler.net/profile/Brotherluii.png
Antworten