一、定义 K-means聚类算法是一种常用的迭代聚类算法,它将n个数据样本划分为k个互不相交的类别。每个类别由一个中心点(质心)代表,该中心点是该类别内所有数据点的均值。算法通过最小化数据点与所属类别中心点之间的距离来实现聚类的目标。 二、原理 K-means算法的原理是基于数据点之间的距离来计算相似性,其中距离...
K-means 聚类算法(自定义实现,对一个 x,y 数据做分类) 本例中可以把 x,y 数据理解为二维坐标上的一个点 K-means 聚类算法是一种把数据分成 k 个组的聚类算法 它先随机选出 k 个数据点作为初始的簇中心,然后计算每个数据点到每个簇中心的距离,把每个数据点分配给距离它最近的那个簇中心,然后根据已有的数...
k均值聚类算法(k-means clustering algorithm)是一种迭代求解的聚类分析算法,其步骤是, 预将数据分为K组,则随机选取K个对象作为初始的聚类中心, 然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。 每分配一个样本,聚类的聚类中心会...
但是,如果集群呈现更复杂的几何形状,那就说明算法在数据聚类方面做得不好。K-means 的另一个缺点是,该算法不允许彼此距离较远的数据点共享同一集群,而不管它们是否属于该集群。K-means 本身不会从数据中了解到集群数量,而是必须预先定义信息。最后,当集群之间出现重叠时,K-means 无法确定如何分配重叠位置的数据点。
摘要 针对传统K-means算法在随机选取聚类中心点出现聚类失败及点云数据重建时在相对平坦的区域出现孔洞的问题,提出一种GK-means的改进聚类算法对点云数据进行精简。该算法首先规定数值K作为最终聚类个数的限定,然后对选点策...展开更多 An improved clustering algorithm of GK-means is proposed to simplify point ...
《一种改进的k-means初始聚类中心选取算法》是王强、蒋正峰等撰写的一篇论文。论文摘要 在传统的k-means聚类算法中,聚类结果会随着初始聚类中心点的不同而波动,针对这个缺点,提出一种优化初始聚类中心的算法。该算法通过计算每个数据对象的密度参数,然后选取k个处于高密度分布的点作为初始聚类中心。实验表明,在聚类类别...
重新定义对象之间相似性度量的距离因子.并将密度思想引入k-means算法,提出类内差分均值的概念确定最优聚类数.实现分区后,分别在这些区域中利用重心法对配送中心进行最终的确定.最后实例分析了在西部地区37个城市创建物流配送中心的选址过程,并通过和传统的k-means聚类的选址结果对比,说明改进后的算法不仅可以节省配送时间...
《基于改进的K-means聚类算法的汽车市场竞争情报分析》是马廷博、刘太安等撰写的一篇论文。摘要 应用AHP(analytic hierarchy process)和EWM(entropy weight method),对中国A级轿车市场数据进行了分析量化处理,设计了竞争威胁数据指标,基于改进的K-means聚类算法对该市场进行了社会网络分析;通过品牌间竞争矩阵构建了中间中心度...
《Radius k-means算法及其拓展问题的研究》是依托郑州大学,由娄铮铮担任项目负责人的青年科学基金项目。项目摘要 项目首次提出Radius k-means,它打破了k-means算法的划分聚类,为每一个簇匹配一个半径R,只有位于以簇质心为中心点、R为半径所覆盖区域内的数据对象才可被指派到该簇中。Radius k-means力图从数据中...