本文主要介绍关于k-means++改进相关的两篇文章: 1. Fast and Provably Good Seedings for k-means 2. Approximate K-menas++ in Sublinear Time k-means++ 相对于 k-menas的算法改进主要在于聚类中心的初始化阶段。 如图所示,左边是原始k-means 算法的初始化阶段,原始算随机选择 k 个点作... ...
植入- 尋找初始叢集中心的工作 - 對於取得 k-Means 的高品質群集至關重要。 不過,K-means++ 植入是最先進的演算法,無法調整為大型數據集,因為它原本是循序的,而且需要 k 完整傳遞數據。 最近顯示,Markov 鏈結蒙特卡洛取樣可用來有效率地近似 k-means++ 的植入步驟。
植入- 尋找初始叢集中心的工作 ,對於取得 k-Means 的高品質叢集而言非常重要。 不過,k-means++ 植入是最先進的演算法,不會妥善調整為大型資料集,因為它原本是循序的,而且需要 k 完整傳遞資料。 最近顯示,Markov 鏈結 Monte Carlo 取樣可用來有效率地近似 k-means++ 的植入步驟。 不...