SSE=k∑i=1∑p∈Ci|p−mi|2 Ci 表示第i个簇,mi表示第i个簇的质心,p是数据样本点。 根据误差平方和SSE来选择K值,但并不是选SSE最小时对应的K,而是选SSE突然变小时的K,如下图,K应选3,图似手肘故得名。 代码语言:javascript 复制 importmatplotlib.pyplotasplt from sklearn.clusterimportKMeans from s...
但是,如果集群呈现更复杂的几何形状,那就说明算法在数据聚类方面做得不好。K-means 的另一个缺点是,该算法不允许彼此距离较远的数据点共享同一集群,而不管它们是否属于该集群。K-means 本身不会从数据中了解到集群数量,而是必须预先定义信息。最后,当集群之间出现重叠时,K-means 无法确定如何分配重叠位置的数据点。
使用K-means算法聚类时,可以利用肘部原理观察()折线图来选择k值。;迭代次数;兰德指数;轮廓系数;欧式距离
在使用 Kmeans 算法进行聚类时,可以利用肘部原理观察 _ 折线图来选择 k 值。A.迭代次数B.兰德指数C.轮廓系数D.欧式距离