显然,相似性度量的选择对的群集,如它们的大小、 质量、 或一致性的属性的影响。若要可靠地比较以上在这里提到的实证分布,我们依靠基于非参数统计测试,例如,皮尔森的 c2 的强统计距离和柯尔-斯米尔诺夫,其产生的 p 值然后验证的交叉熵 Leibler 分歧。这些方法是最常用来确定是否两个基础一维概率分布不同的重要方式...