Separater Validation set unnötig duch cross_validation_score?

nichtSoGuter · Mittwoch 21. September 2022, 20:58

Ist ein seperater valdiation set neben dem train und dem test set unnötig, wenn man cross_validation_score von sklearn verwendet? Dabei wird ja sowieso ein teil des train sets ausgelassen für die evaluation.
Wozu nützt dann das validation set?

ThomasL · Donnerstag 22. September 2022, 13:44

Schau mal hier rein: https://stephenallwright.com/cross_validate-sklearn/

Was mir da nicht gefällt, ist das er in der ersten Grafik den Begriff Testdata verwendet. Das ist falsch. Es müsste Validation Data heißen.

Cross Validation wird auf die Traningsdaten angewendet. Wenn die daraus resultierende Genauigkeit, nach Justage der Trainingsparameter, ok ist,
wird immer abschließend auf die zuvor von der Gesamtheit der vorliegenden Daten abgetrennten Testdaten einmalig validiert.
Die daraus resultierende Genauigkeit ist die einzig relevante Maßeinheit für das Modell.