K - Means 算法的核心思想是将数据集划分为 K 个簇,使得簇内数据点的距离尽可能小,而簇间距离尽可能大。它通过不断迭代更新簇中心和重新分配数据点来实现聚类。其局限性主要体现在以下几个方面:初始聚类中心的敏感性:K - Means 算法的结果对初始聚类中心的选择非常敏感。不同的初始中心可能会导致完全不同的...
摘要:启发式k-means聚类算法通过在k-means第一次迭代后查看附近的集群来预测每个数据点可能会被划分到的集群子集,有效地加快了算法的运行速度。但由于启发式算法存在随机选择初始聚类中心以及无法有效识别数据集中离群点的缺陷,导致聚类结果的误差平方和较...
中文摘要: 为了消除传统的谱聚类图像分割算法存在的缺陷,提出一种改进的谱聚类图像分割算法。该算法提出余弦相似性加权矩阵,充分利用图像的纹理信息和空间临近信息构造相似性矩阵。在谱映射过程中,利用Nystr m逼近策略估计相似性矩阵及其主特征向量。最后利用优化的K-mean...
为解决传统聚类算法对大数据背景下高维海量,类簇形状差异巨大的电力负荷曲线进行聚类分析时存在的聚类结果不稳定,聚类效果较差,聚类速度慢和内存消耗过大等问题,提出一种改进的快速密度峰值聚类算法.首先应用主成分分析法对归一化后的负荷曲线集进行降维处理,以减少样本向量间欧式距离的计算量和加快后续操作.然后利用kd树算...
并以此作为后续聚类算法的输入.其次,本文针对传统Canopy算法难以确定最佳T1和T2对聚类结果造成的影响,提出了基于密度权重的改进Canopy算法,通过引入密度权重来确定所有初始聚类中心,代替了原始的划分方法.然后利用改进的Canopy算法来解决K-means算法人为确定k值以及随机选取初始聚类中心的问题,来提高K-means算法的聚类效果....
首先通过对稀疏自编码器进行训练,获取数据重要的线性及非线性特征,从而对原数据进行降维;然后,利用改进BIRCH聚类算法对降维后的数据进行聚类,辨识出低压配电网中台区之间的拓扑关系.通过算例结果验证以及与其他方法进行对比,证明该方法较之传统方法能够更高效地辨识低压配电网台区的拓扑关系,为后续数据分析和决策支持提供了...
主要内容:代码主要做的是基于改进k-means算法的场景生成,具体为含有电动汽车负荷的场景聚类问题,其中,光电和电负荷用有序聚类方法,风电加电动汽车负荷用的是k-means方法,具体过程为 1、对光电有序聚类(分开),根据轮廓系数找出合适的断点向量;2、对电负荷有序聚类(分开),根据轮廓系数找出合适的断点向量;3...
基因表达数据隐藏着丰富的生物信息,双聚类算法是挖掘这些生物信息的有效手段.双聚类算法一直被认为是一个NP-hard问题,而蝙蝠算法在解决NP-hard问题上有很大的优势.本文在蝙蝠算法的基础上提出了一种基于改进蝙蝠算法的双聚类算法(Bi-clustering based on Improved Bat Algorithm,BIBA).通过在酵母细胞基因数据集上的实验...
首先基于改进的K-means聚类算法对原始场景进行快速分类,其次针对每一类簇中的场景集合采用基于Kantorovich距离的SBR算法进行缩减.该方法可以在保证计算精度的同时,提高规模较大场景集合缩减的计算效率.最后采用我国西北某省网风功率实际数据开展实证分析,通过布莱尔分数(Brier score,BS)指标和风功率波动的高斯混合模型验证了...
P2P网络下基于K-Wmeans聚类算法的Web服务发现研究 针对P2P网络的动态性,分布性等特点,提出了一种运用加权改进的K-Wmeans算法对Web服务进行聚类分析的方法.通过对P2P网络中各个节点上Web服务进行分布式聚类,可使服务请... 李静,张永胜,刘广钰,... - 《计算机工程与应用》 被引量: 21发表: 2009年 基于密度的...