增量式K-means:对于大规模数据集,可以采用增量式K-means算法进行分布式计算,提高计算效率。 引入核函数:将K-means算法扩展为Kernel K-means算法,使用核函数将数据映射到高维空间,处理非线性可分的数据。 K-means++ K-means++ 是一种改进的 K-means 算法,主要针对初始质心选择的问题。K-means++ 的优势在于能够选...
手肘法是最常用的确定K-means算法K值的方法,所用到的衡量标准是SSE(sum of the squared errors,误差平方和) 。 SEE各个计算在K-means里含义如下图: 误差平方和又称残差平方和,根据n个观察值拟合适当的模型后,余下未能拟合部份( )称为残差,其中y平均表示n个观察值的平均值,所有n个残差平方之和称误差平方和。