其计算公式为: Calinski-Harabasz指数= (tr(B_k) / tr(W_k)) × (n_E - k) / (k - 1) 其中,n_E为训练样本数,k为类别数,B_k为类别之间的协方差矩阵,W_k为内部数据的协方差矩阵,tr()表示矩阵的迹。类别内部数据的协方差越小越好,类别之间的协方差越大越好,这样的Calinski-Harabasz分数会高。
Calinski-Harabasz 指数(CH 指数)的计算方法如下: 假设我们将数据分为k个聚类,令n为数据点的总数,x_i表示第i个数据点,C_j表示第j个聚类的集合。 首先,计算总体的均值M:
Calinski-Harabasz 指数(CH 指数)的计算方法如下: 假设我们将数据分为k个聚类,令n为数据点的总数,x_i表示第i个数据点,C_j表示第j个聚类的集合。 首先,计算总体的均值M: