12.剔除iv值过大的变量,例如iv>0.5(iv较高的变量适合用来做强规则,同时高iv变量不稳定不适合作为评分建模变量) 13.剔除业务解释性不强或者相反的变量 14.按照训练集剔除变量列表,去同步剔除测试集的变量,统一两个样本集的变量 ▍评分卡模型建模流程-建立模型与评估 1.基于逻辑回归模型,建立评分卡模型 2.根据评分...
评分卡里叫变量,在建模时,我们叫特征。但在评分卡里,我们需要对变量进行分箱(binning),效果如图二的fico评分卡。分箱怎么做的呢? 我有空会做一个专题。这里先简单搞个分箱策略,值比较多的用pandas.qcut,值比较少的用pandas.cut。qcut和cut的区别是,qcut是根据这些值的频率来选择箱子的间隔,以实现尽量每个分箱...
流程第一步是模型定义先开路 二.理清自家数据情况 一般这一步跟第三步是可以同时进行,数据处理得多了,大概也知道自家的数据。把报告的信息输出到数据准备和分析报告里。 理清楚自家公司的数据库存,看下数据维度是否丰富,能否支持你能开发一张评分卡,需要用时间序列梳理下变量的情况。 这里需要看自己家的数据是否有...
基于逻辑回归的评分卡主体模型流程包括:样本分区与抽样、变量分箱、变量预筛选、变量转换WOE、逻辑回归、模型验证、评分校准、生成评分卡等。 WOE(Weight of Evidence)即证据权重,可以将logistic回归模型转化为标准评分卡格式。WOE是对原始自变量的一种编码形式,要对一个变量进行WOE编码,需要首先把这个变量进行分组处理(...
图1是本申请实施例提供的信用评分卡模型的建模方法的流程图,本实施例可适用于信用评分卡模型建立的情况,该方法可以由本申请实施例所提供的信用评分卡模型的建模装置执行,该装置可以由软件和/或硬件的方式来实现,并可集成于智能终端等电子设备中。 如图1所示,所述信用评分卡模型的建模方法包括: ...
基于gbdt算法的评分卡模型的建模方法,包括以下步骤: 步骤一:建模样本的选择定义,首先根据产品业务定义样本的正负,其次抽取建模样本,排除特殊客户; 步骤二:数据特征获取,从步骤一中的建模样本中获取特征数据,所述特征数据包括人行征信、职业特征、收支状况、银行流水、职业特征、身份地位以及客户授权获取的第三方数据,得到模...
逻辑回归。根据筛选后的特征,构建逻辑回归模型。 评分卡转换。根据一定的公式转换。 验证并上线。验证评分卡效果,并上线持续监测 评分卡建模步骤 是不是看起来有点抽象呢?真正的干货马上来,赶紧去上个厕所,冲好咖啡,因为下面的干货太满了! 四、评分卡构建实战演练 ...