5, 对噪音和异常点比较的敏感(改进1:离群点检测的LOF算法,通过去除离群点后再聚类,可以减少离群点和孤立点对于聚类效果的影响;改进2:改成求点的中位数,这种聚类方式即K-Mediods聚类(K中值))。 注意:K-Means聚类中选择欧几里德距离计算距离,数据集单位不一致、数据量级差异较大时,一定要进行数据的标准化(nor...
阿泽:【机器学习】K-means(非常详细)
2、原理简单,实现容易。 缺点: 1、聚类中心的个数K 需要事先给定,但在实际中这个 K 值的选定是非常难以估计的,很多时候,事先并不知道给定的数据集应该分成多少个类别才最合适; 2、Kmeans需要人为地确定初始聚类中心,不同的初始聚类中心可能导致完全不同的聚类结果。(可以使用K-means++算法来解决); 3、结果不...