k均值聚类算法(k-means clustering algorithm)是一种迭代求解的聚类分析算法,其步骤是,预将数据分为K组,则随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚类中心会根据聚...
下列属于k-means算法的不足的是A.簇个数k需要预先指定,但实际上难以确定B.由于簇的质心(即均值)作为簇中心进行新一轮聚类计算,孤立点和噪声点会导致簇质心偏离真正的数据密集区,所以k-means对噪声点和孤立点很敏感C.不能用于发现非凸形状的簇,或具有各种不同大小或密度的簇。例如图3-1所示的两个簇,用k-...