Clustering mit K-Means
Verfasst: Dienstag 21. Februar 2017, 09:35
Hallo,
ich würde gerne den K-Means Clusteralgorythmus auf meine Datensäte anwenden.
Und ich würde heraus finden, ob die Daten einer bestimmten Logik folgen.
http://scikit-learn.org/stable/modules/ ... ter.KMeans
Leider hab ich keine Ahnung vom Programmieren.
Die Ausprägungen der Spalten sind wie folgt:
ID: Ein String aus Buchstaben und Nummern
ABC: A, B, C
XYZ: X, Y, Z
UVW: U, V, W
MSE: Nimmt Werte von 0 bis sehr große Zahlen an
Meine Input-Daten schauen wie folgt aus alles ist in CSV-Format gespeichert.
ID ABC XYZ UVW MSE
10 A X U 102000,32
12 B Y V 9000,78
Ich würde gerne als Ergebnis eine CSV-Datei bekommen, wo drin steht ID 10 ist in Cluster 1 usw.
Der Clusterobergrenze sollte bei mir 4 sein.
Nach meiner Recherche kann man metrisch und skalierte Skalen nicht Gruppieren, deswegen wollte ich jetzt versuchen nur die skalierte Spalte (MSE) nutzen und dann darauf Rüchschlüsse auf Ihre Attributen ziehen.
Könnte mir jemand bei der Umsetzung helfen?
ich würde gerne den K-Means Clusteralgorythmus auf meine Datensäte anwenden.
Und ich würde heraus finden, ob die Daten einer bestimmten Logik folgen.
http://scikit-learn.org/stable/modules/ ... ter.KMeans
Leider hab ich keine Ahnung vom Programmieren.
Die Ausprägungen der Spalten sind wie folgt:
ID: Ein String aus Buchstaben und Nummern
ABC: A, B, C
XYZ: X, Y, Z
UVW: U, V, W
MSE: Nimmt Werte von 0 bis sehr große Zahlen an
Meine Input-Daten schauen wie folgt aus alles ist in CSV-Format gespeichert.
ID ABC XYZ UVW MSE
10 A X U 102000,32
12 B Y V 9000,78
Ich würde gerne als Ergebnis eine CSV-Datei bekommen, wo drin steht ID 10 ist in Cluster 1 usw.
Der Clusterobergrenze sollte bei mir 4 sein.
Nach meiner Recherche kann man metrisch und skalierte Skalen nicht Gruppieren, deswegen wollte ich jetzt versuchen nur die skalierte Spalte (MSE) nutzen und dann darauf Rüchschlüsse auf Ihre Attributen ziehen.
Könnte mir jemand bei der Umsetzung helfen?