给定一个数据点集合和需要的聚类数目K,K由用户指定,K均值算法根据某个距离函数反复把数据分入K个聚类中。 K均值算法优势在于它速度很快,原理简单、易于操作,但是也有缺点:(1)必须选择有多少个组或类;(2)不同的算法运行中可能产生不同的聚类结果,结果不可重复,缺乏一致性;(3)常常终止于局部最优;(4)对噪声和...