ich hab ein großes Problem. Ich soll in Python eine Clusteranalyse mit Hilfe der Zentroidmethode durchführen
und das ohne den vorgefertigten Clusterbefehl. Mit der Distanzmatrix hatte i keine Probleme, aber das eigentliche Clustering
fehlt mir schwer. Abbruchbedienung soll sein das i nur noch zwei Cluster habe und i soll am Ende die Distanz zwischen den beiden zentren finden. Mein bisheriger Quellcod sieht wie folgt aus:
Code: Alles auswählen
import numpy as np
from math import sqrt
import os
os.chdir('D:/Uni/sas/Beleg/')
wd = os.getcwd()
#############
# Load Data #
#############
Data = np.genfromtxt(
wd + '/hematology.txt',
dtype = float
#delimiter = '\t',
)
##################
# Distancmatrix #
##################
[z,s]=Data.shape
D = np.zeros([z,z],float)
for k in range(0,z,1):
for l in range(0,z,1):
summe=0
for j in range(0,s,1):
summe=summe+ (Data[k,j]-Data[l,j])*(Data[k,j]-Data[l,j])
D[k,l]=sqrt(summe)Weiß auch nicht, wie ich die ganzen Informationen, die beim Clustern entstehen, speichern soll.
