K-means中心思想:事先确定常数K,常数K意味着最终的聚类类别数,首先随机选定初始点为质心,并通过计算每一个样本与质心之间的相似度(这里为欧式距离),将样本点归到最相似的类中,接着,重新计算每个类的质心(即为类中心),重复这样的过程,直到质心不再改变,最终就确定了每个样本所属的类别以及每个类的质心。由于每次...
Canopy算法是为了解决Kmeans需要人为指定K值的问题。因为有时如果数据点应该是分成三类为佳,我们却将K值指定为4,那么分类效果就不会很好。当然,如果我们必须要将数据分成4类,那把K人为指定为4是没问题的,但如果只是为了将数据“自适应”地聚类,就可以考虑使用Canopy算法来帮我们找到合适的K值。 其实Canopy属于一种‘...
视频:2-3 K-means算法理论步骤(09:20) 视频:2-4 K-means算法的性能分析(06:38) 视频:2-5 K-means算法调优过程(07:28) 视频:2-6 K-means算法改进(03:00) 第3章 K-Means聚类算法编程实现 视频:3-1 k-means算法实战(上)(24:20) 视频:3-2 K-means算法实战(下)(10:37) 视频:3-3...
Kmeans聚类是我最早接触的,也是最简单的机器学习聚类算法了。它是一种无监督学习算法。 原理: 还是先简单过一下Kmeans聚类的过程吧。不像模像样地罗列个一二三四,直接口述一下过程就好:比如我们要对二维坐标下一堆散列的点进行Kmeans聚类,我们要提前指定K的值,然后随机选择k个点作为k个聚类中心。此时我们计算其他...
视频:2-5 K-means算法调优过程(07:28) 视频:2-6 K-means算法改进(03:00) 第3章 K-Means聚类算法编程实现 视频:3-1 k-means算法实战(上)(24:20) 视频:3-2 K-means算法实战(下)(10:37) 视频:3-3 K-means算法实战调优过程(10:25) 视频:3-4 K-means算法小结(04:28) 第4章 决策...