然而,当聚类数目k的值较大时,CH指数可能失去意义,因为此时类内距离可能变得很小,导致CH值偏大。 三、Davies-Bouldin Index(DB) Davies-Bouldin Index(DB)是一种基于类内距离和类间距离的内部评价指标,用于衡量聚类的紧密度和分离度。DB值的计算原理是计算任意两个聚类之间的类内距离平均之和除以该两类中心距离,...
因此,对于小数据集(样本数量< 1000)或大量簇(> 10),使用ARI更安全。 4、Fowlkes-Mallows Index(FMI) Fowlkes-Mallows Index (FMI)[5]定义为对精度(分组点对的准确性)和召回率(正确分组在一起的对的完整性)的几何平均值: TP(True Positive)是具有相同类标签并属于同一簇的点对的数量。FP (False Positive)...