k-means是聚类算法,knn是有监督的分类算法;聚类没有标签,分类有标签 聚类算法中的k是k类,knn中的k是k个最近的邻居。 k-means优点: 计算简单,可解释性强。 k-means缺点: 需要确定分类数 ,一般根据经验或者已经有预判,其次是根据R语言提供的暴力试错k值选择最合适的分类数k。初始值的选取会影响最终聚类效果,并...
当聚类数等于5时,k-means聚类效果较好。 该文利用charls数据库两年的数据,采用描述性统计及差异性分析,单因素和多因素logistic回归分析以及限制立方样条模型,都是比较简单的统计方法,还做了亚组分析及交互作用分析来丰富研究。 描述性统计与差异性分析都采用基础的分类方法,连续数据描述用均值和标准差,分类数据描述用百...