算法的可扩展性:K均值聚类算法在处理大规模数据集时相对高效,但在高维数据上可能会遇到维度灾难,此时需要降维或使用其他算法。 实验结论:实验结果表明,K均值聚类算法在iris数据集上能够获得合理的聚类效果。通过无监督评估指标,我们验证了聚类的合理性。同时,通过将聚类结果与真实标签的映射,我们得到了一个关于聚类效果...
k 均值聚类是使用最大期望算法(Expectation-Maximization algorithm)求解的 高斯混合模型(Gaussian Mixture Model, GMM)在正态分布的协方差为单位矩阵,且 隐变量的后验分布为一组狄拉克δ函数时所得到的特例。 ——— 二、算法代码 三、仿真实验结果及其分析 图1 从图中可知,较好的K值为2或3 图2 k=2时 图3...