gap statistic公式 gap statistic是用来评估聚类结果的合理性和确定最佳聚类数目的一种方法。它的计算公式如下: gap(k) = E[log(Wk)] - log(Wk) 其中,k是聚类的数目,E[log(Wk)]表示期望平均内部离差平方和的对数,log(Wk)表示实际的内部离差平方和的对数。 具体计算步骤如下: 1.对数据集进行k个聚类,计算...
Gap statistic与K-means算法