Clusteranalyse
Verfasst: Freitag 1. Juli 2011, 16:08
Hi,
ich hab ein großes Problem. Ich soll in Python eine Clusteranalyse mit Hilfe der Zentroidmethode durchführen
und das ohne den vorgefertigten Clusterbefehl. Mit der Distanzmatrix hatte i keine Probleme, aber das eigentliche Clustering
fehlt mir schwer. Abbruchbedienung soll sein das i nur noch zwei Cluster habe und i soll am Ende die Distanz zwischen den beiden zentren finden. Mein bisheriger Quellcod sieht wie folgt aus:
Brauche ganz dringend Hilfe!
Weiß auch nicht, wie ich die ganzen Informationen, die beim Clustern entstehen, speichern soll.
ich hab ein großes Problem. Ich soll in Python eine Clusteranalyse mit Hilfe der Zentroidmethode durchführen
und das ohne den vorgefertigten Clusterbefehl. Mit der Distanzmatrix hatte i keine Probleme, aber das eigentliche Clustering
fehlt mir schwer. Abbruchbedienung soll sein das i nur noch zwei Cluster habe und i soll am Ende die Distanz zwischen den beiden zentren finden. Mein bisheriger Quellcod sieht wie folgt aus:
Code: Alles auswählen
import numpy as np
from math import sqrt
import os
os.chdir('D:/Uni/sas/Beleg/')
wd = os.getcwd()
#############
# Load Data #
#############
Data = np.genfromtxt(
wd + '/hematology.txt',
dtype = float
#delimiter = '\t',
)
##################
# Distancmatrix #
##################
[z,s]=Data.shape
D = np.zeros([z,z],float)
for k in range(0,z,1):
for l in range(0,z,1):
summe=0
for j in range(0,s,1):
summe=summe+ (Data[k,j]-Data[l,j])*(Data[k,j]-Data[l,j])
D[k,l]=sqrt(summe)Weiß auch nicht, wie ich die ganzen Informationen, die beim Clustern entstehen, speichern soll.