目前在文献中存在着大量的聚类算法,算法的选择取决于数据集的类型、聚类的目的和应用。如果聚类分析被用作描述或探查的工具,可以对同样的数据集尝试多种算法,以发现数据集可能揭示的结果。 1 基于划分的聚类分析算法及改进 聚类分析,一般认为就是试图发现数据点集中内在的结构,使同一簇内的数据点相似度高,不同簇之间...
聚类分析算法是数据挖掘中最为主要的研究领域之一,聚类分析是一种无监督的机器学习算法,事先不需要对数据集进行训练学习,k-means算法是一种划分式聚类算法。由于,k-means算法思想相对简单,且该算法易于实现以及对于大数据集具有较好的伸缩性等优点,在实际中应用的最为广泛。但是k-means算法也有很多不尽人意的地方。
基于划分的聚类算法的改进及其应用 来自掌桥科研 作者 宋阳 摘要 聚类是数据挖掘中非常热门的研究方向,是将数据集划分为不同的簇的过程,其目的是使同簇中的样本相异度较低,不同簇间的样本相异度较高.随着信息技术的快速发展与海量数据的产生,人们对聚类算法的效率,可靠性以及可扩展...
9 0 2 1期 常晓磊,等:基于空间定位的聚类算法在电信业客户划分中的应用 311 数据预处理 首先采用了无锡汇隆公司近两年的客户数、通 话、短信、充值, 通过属性删减和不完整数据的删 除, 最终选取的客户属性为: {年龄, 收入, 受教育程 度, 职业, 通话次数, 短信发送量, 联系人数目, 充值 ...
基于空间定位的聚类算法在电信业客户划分中的应用 维普资讯 http://www.cqvip.com
采用数据挖掘中聚类的方法对电信业的客户进行划分,在比较了现有聚类算法计算复杂度普遍较高的的基础上,采用了一种基于空间定位的方法,将客户数据对象映射到特征空间中,并利用空间立方体的某些特殊顶点定位任意数据,通过计算数据点与空间立方体顶点群的距离差异,完成聚类过程。为了适合电信业客户的特殊性质,改进对客户属性...