聚类算法会从n个类的初始中心开始(如果没有人为设置,其会按照随机的初始中心开始) 什么意思呢?来看一张图 上图中,左一的圆圈表示原始数据在随机的初始中心划分后的的分布 但是可以看出很明显cluster1中有很多是靠近cluster2的数据点 所以kmeans会根据规则再次计算出更加合适的中心点来进行划分 这个规则就是: 计算每...
plt.show() #3、测试9种不同聚类中心数量下,每种情况的聚类质量,并作图。 K=range(1,10) meandistortions=[] forkinK: kmeans=KMeans(n_clusters=k) kmeans.fit(X) meandistortions.append(sum(np.min(cdist(X,kmeans.cluster_centers_,'euclidean'),axis=1))/X.shape[0]) plt.plot(K,meandistorti...
plt.show() #3、测试9种不同聚类中心数量下,每种情况的聚类质量,并作图。 K = range(1, 10) meandistortions = [] for k in K: kmeans = KMeans(n_clusters=k) kmeans.fit(X) meandistortions.append(sum(np.min(cdist(X, kmeans.cluster_centers_, 'euclidean'), axis=1))/X.shape[0]) pl...