Handling von Imbalanced Datasets

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
nichtSoGuter
User
Beiträge: 92
Registriert: Mittwoch 13. April 2022, 17:40

Ich habe ein sehr stark unausgeglichenes Dataset mit 131 Samples in der minjority Klasse und fast 30000 Samples in der majority Klasse.

Ich habe versucht mit over-/undersampling versucht und mit den Algorithmus spezifischen Parametern (wie z.B. scale_pos_weight bei Xgboost) meine Performance der Algorithmen zu erhöhen. Leider hält sich der erfolg sehr stark in Grenzen.

Hat noch jemand eine Idee wie man mit so startk unausgeglichenen Datasets umgeben könnte?

Vielen Dank im Voraus!

LG
__deets__
User
Beiträge: 14545
Registriert: Mittwoch 14. Oktober 2015, 14:29

Bei Bildverarbeitung kann man sich Daten generieren, zb durch Spiegeln, leichtes verzerren und verrauschen. Vielleicht lässt sich sowas auch bei deinen Daten machen.
Antworten