我们每设定一个阈值,我就计算下这个阈值下判定垃圾邮件的性能指标。然后将这个指标画成一条曲线,这条曲线就是ROC曲线。ROC曲线下面的面积就是AUC值。 那么问题来了,ROC用了哪些评估阈值好不好的性能指标?答:有两个。 召回率。正确分类为垃圾邮件的数目占样本中标记为垃圾邮件数目的比率。\frac {TP} {样本中标记...
ROC曲线下面的面积就是AUC值。 那么问题来了,ROC用了哪些评估阈值好不好的性能指标?答:有两个。 召回率。正确分类为垃圾邮件的数目占样本中标记为垃圾邮件数目的比率。 非垃圾邮件中判断错误的比率(明明是非垃圾邮件,判断成了垃圾邮件,那是不是阈值太小了,比如10%就认为是垃圾邮件)。 k-fold Cross Validation ...