C均值聚类(更常用的叫法是K均值算法,K-means clustering)是经典的非监督数据处理方法。实验目的在于加深学生对C均值聚类原理的理解、掌握的算法的实现过程,体会其在模式识别中的作用。 1实验原理 设定C个类别并选取C个初始聚类中心,按最小距离原则将各样本分配到C类中的某一类;之后不断地计算各类中心并调整各样本...
分类器的强弱之分以分类器的稳定性为评估标准,分类器稳定性越强,分类器越强;分类器越不稳定,分类器越弱。 那么何谓分类器的稳定性呢? 分类器的稳定性指在输入数据发生变化时,分类器预测结果的稳定性。举个例子,对于一个样本集,随机划分为训练集和测试集。在第一次训练模型预测准确率为56%,而第二次训练模型预...