1.原始定义公式:KS = max(TPR - FPR) 2.实际应用公式:KS = max(N0(p<pb) / N0 - N1(p<pb) / N1) 其中,TPR(True Positive Rate)是查全率,是1的样本被检查出来的概率;FPR(False Positive Rate)是虚警率,是0的样本被误检成1的概率。N0和N1分别代表类0和类1的样本数量。p<pb表示切点以下,类0的...
KS值计算公式为KS = max(TPR - FPR),其中TPR为真正类率,FPR为假正类率。该公式通过寻找两类样本累积分布差值最大值,衡量模型的分类区分能力,尤其适用于信用评分等场景。 一、核心指标定义 TPR(真正类率): TPR表示模型正确识别正例(如信用评分中的“好客户”)的能力,计算公式为: [ TP...
KS曲线:横坐标是阈值,纵坐标是TPR与FPR之差。KS值就是KS曲线的峰值,计算公式为KS=max(TPR-FPR)。例如,当阈值等于40%时,TPR为80%,FPR为25%,所以(TPR-FPR)值为55%,这个值是所有阈值条件下最大的(TPR-FPR)值,因此,这个模型的KS值为55%。 ROC曲线:横坐标是FPR,纵坐标是TPR。虽然ROC曲线也是以阈值作为变...
阈值为0到100分之间的分数时,每一个阈值都会得到对应的TPR和FPR值,比如TPR=0.7,FPR=0.4 我们依次把阈值依次定位0、10、20,一直到100,就会得到一串TPR和FPR数据的集合,然后我们把FPR作为横轴,TPR作为纵轴,把这些点在坐标系中连起来,就可以得到一条ROC曲线: 图中蓝色的曲线就是ROC曲线,图中的虚线是随机线,随机...
而KS值是MAX(TPR – FPR),即两曲线相距最远的距离。 不同的产品,合适的KS值范围都不一样,需要结合实际情况去摸索。 一旦确定合适的KS值范围之后,如果模型的KS值过低,说明模型欠拟合,基本不可用,但KS值非常高也不一定是好事情,我们可能需要分析原因,判断是否是因为数据问题导致的异常情况。
从K-S曲线就能衍生出KS值,KS=max(TPR-FPR),即是两条曲线之间的最大间隔距离。当(TPR-FPR)最大时,也就是ΔTPR-ΔFPR=0,这和ROC曲线上找最优阀值的条件ΔTPR=ΔFPR是一样的。从这点也可以看出,ROC曲线、K-S曲线、KS值的本质是相同的。
fpr,tpr,thresholds= roc_curve(y_score, y_test)# y_score is score of positive label ks =max(tpr-fpr)# Note: tpr and fpr is ndarray print(ks) 参考: How to Measure the Quality of Credit Scoring Models https://www.zhihu.com/question/34820996?sort=created...
KS曲线是两条线,其横轴是“阈值”(区间序号,按概率排序的等份),纵轴是TPR(上面那条)与FPR(下面那条)的值,值范围[0,1] 。两条曲线之间之间相距最远的地方对应的阈值,就是最能划分模型的阈值。 通常来讲,KS>0.2即表示模型有较好的预测准确性。 求解方法等于:KS=max(TPR-FPR)。 在上图中就是红色竖直线。
KS=max(TPR−FPR)KS=max(TPR−FPR) 取值说明: KS<0.2 模型的区分能力不高,价值不大; 0.2<=KS<0.4 一般金融机构开发的评分模型KS大部分都集中在这个区间内,模型具备一定的区分能力和使用价值,此时可以结合其他指标继续观察调优模型; 0.4<=KS<=0.7 模型区分能力比较好,模型有应用价值; KS>0.7 模型好的难以...
KS(Kolmogorov-Smirnov)值定义为TPR与FPR的差的最大值。 KS值 =max(TPR−FPR) 应用: 一般,希望模型有较大的KS值,意味着模型有较强的区分能力。但是也不是越大越好,如果KS值超过0.75,往往表示模型有异常。 KS值对应的模型预测概率即最优阈值,选择此预测概率值作为0、1分类的分界线,可使模型取得最优分类效果...