K-means算法是基于划分的聚类算法之一,基本思想[6]是:从包含n个对象的数据集中随机选取k个样本点作为初始聚类中心,对于剩下的每个对象,计算其与各个聚类中心的距离,将它分配到最近的聚类,并重新计算聚类中心,再将所有的样本点依据最近距离原则分配到相应的聚类簇中,不断地迭代直到分配稳定,即聚类误差平方和E收敛。
基于优化初始中心点的K-means文本聚类算法
遗传算法一个好的K-means聚类算法至少要满足两个要求:(1)能反映聚类的有效性,即所分类别数要与实际问题相符;(2)具有处理噪声数据的能力.传统的K-means算法是一种局部搜索算法,存在着对初始化敏感和容易陷入局部极值的缺点.针对此缺点,提出了一种优化初始中心的K-means算法,该算法选择相距最远的处于高密度区域的...
聚类中心分选算法初始means信号 文章编号:1001-2486(2009)02-0070-06基于优化初始聚类中心K-Means算法的跳频信号分选X陈利虎1,张尔扬1,沈荣骏2(1.国防科技大学电子科学与工程学院,湖南长沙410073;2.解放军总装备部科学技术委员会,北京100080)摘要:提出了一种优化初始聚类中心的方法。方法通过搜索参数统计直方图峰值预...
means聚类算法初始聚类中心以及聚类数目K是随机确定的,聚类结果受其影响较大,这样容易造成聚类结果不稳定且准确率较低.针对上述问题,本文提出一种基于优化初始聚类中心和轮廓系数的K-means聚类算法.首先,为了选出准确的初始聚类中心,引入平均样本距离和误差平方和,构造初始聚类中心的选取方法,使得选取的初始聚类中心是样本...
基于初始聚类中心优化和维间加权的改进K—means算法
92%.%针对K-means算法易受随机选择的初始聚类中心的影响和划分准确率不高的缺点,给出了一种改进的K-means算法.首先对初始聚类中心的选择过程进行了改进,然后对各样本点间差异最大的维进行加权处理.在Iris数据集上对原始算法和改进后的K-means算法的聚类结果进行对比分析.实验证明:改进后的算法稳定,且聚类...
针对传统K-均值聚类算法对初始聚类中心敏感、现有初始聚类中心优化算法缺乏客观性,提出一种基于样本空间分布密度的初始聚类中心优化K-均值算法.该算法利用数据集...
K-Means算法是一种简单有效并得到广泛应用的聚类算法,然而K-Means算法初始聚类中心选择的随机性经常导致算法聚类效果的不稳定。为此本文提出一种优化初始聚类中心的策... 张斌,魏振钢,范韬,... - 国际信息技术与应用论坛 被引量: 7发表: 2011年 K-means初始聚类中心优化算法研究 由于K-means算法对初始中心的依赖...
给出了一种稳定的基于影响空间的初始点优化K-means聚类算法.该算法借助了影响空间数据结构和定义的加权距离吸引因子,将特殊中心点合并为K个微簇,并对微簇中的数据点加权平均得到K个初始中心点,然后执行K-means算法;最后,理论分析和实验结果表明,该初始点优化K-means聚类算法能够有效降低噪声数据对聚类结果的影响,在...