Ist ein seperater valdiation set neben dem train und dem test set unnötig, wenn man cross_validation_score von sklearn verwendet? Dabei wird ja sowieso ein teil des train sets ausgelassen für die evaluation.
Wozu nützt dann das validation set?
Separater Validation set unnötig duch cross_validation_score?
Schau mal hier rein: https://stephenallwright.com/cross_validate-sklearn/
Was mir da nicht gefällt, ist das er in der ersten Grafik den Begriff Testdata verwendet. Das ist falsch. Es müsste Validation Data heißen.
Cross Validation wird auf die Traningsdaten angewendet. Wenn die daraus resultierende Genauigkeit, nach Justage der Trainingsparameter, ok ist,
wird immer abschließend auf die zuvor von der Gesamtheit der vorliegenden Daten abgetrennten Testdaten einmalig validiert.
Die daraus resultierende Genauigkeit ist die einzig relevante Maßeinheit für das Modell.
Was mir da nicht gefällt, ist das er in der ersten Grafik den Begriff Testdata verwendet. Das ist falsch. Es müsste Validation Data heißen.
Cross Validation wird auf die Traningsdaten angewendet. Wenn die daraus resultierende Genauigkeit, nach Justage der Trainingsparameter, ok ist,
wird immer abschließend auf die zuvor von der Gesamtheit der vorliegenden Daten abgetrennten Testdaten einmalig validiert.
Die daraus resultierende Genauigkeit ist die einzig relevante Maßeinheit für das Modell.
Ich bin Pazifist und greife niemanden an, auch nicht mit Worten.
Für alle meine Code Beispiele gilt: "There is always a better way."
https://projecteuler.net/profile/Brotherluii.png
Für alle meine Code Beispiele gilt: "There is always a better way."
https://projecteuler.net/profile/Brotherluii.png