Hallo zusammen,
ich bin erst seit wenigen Monaten am Programmieren und dies ist mein erster Eintrag hier im Forum. Bin mir auch nicht sicher ob hier der richtige Platz ist für mein Problem, deshalb bitte ich um Nachsicht.
Im Rahmen einer Projektarbeit habe ich die Daten von Beschleunigungssensoren als Zeitserie bekommen.
Dabei handelt es sich um die Daten von Kugellagern und deren verschiedenen Schadenskategorien mit unterschiedlichen Ausprägungen.
Ziel ist es alle Schadenskategorien mittels des kmeans Algorithmus zu erkennen(Predictive Maintenance). Ich weiß, es handelt sich um gelabelte Daten und daher wäre ein Supervised Algorithmus vermutlich passender. Das ist jedoch die Vorgabe von meinem Professor.
Mit einer Feature-Selection mit TSfresh und rauspicken einiger redundanter Features detektiert der Algorithmus bereits 8 von 12 Kategorien richtig. Die restlichen 4 Kategorien wirft er jedoch alle ins gleiche Cluster, da ich einfach keine Features in der Zeitserie finde, welche diese Kategorien unterteilen könnten. Habt ihr für mich irgendwelche Tipps und Ideen wie sich diese vermeintlich gleichen Zeitserien mittels kmeans in ihre 4 Untergruppen aufteilen lassen? Danke schon mal