1.Kmeans对噪声抗干扰较弱,通过Canopy对比,将较小的NumPoint的Cluster直接去掉有利于抗干扰。 2.Canopy选择出来的每个Canopy的centerPoint作为K会更精确。 3.只是针对每个Canopy的内做Kmeans聚类,减少相似计算的数量。 缺点: 1.算法中 T1、T2的确定问题 ,依旧可能落入局部最优解 2 K-means++ 其中: 为方便后面...