sns.barplot(df_train["grade"].value_counts().index, df_train["grade"].value_counts().values) 可以看出A\B\C等级的贷款占比比较大 五、数据间的关系分析 预测值的分布 首先我们看看预测值的分布情况,可以直接可视化显示,代码如下: df_train["isDefault"].value_counts().plot.bar() df_train["isDe...
七、特征选择 特征选择技术可以精简掉无用的特征,以降低终模型的复杂性,它的终目的是得到一个简约模型,在不降低预测准确率或对预测准确率影响不大的情况下提高计算速度。特征选择不是为了减少训练时间(实际上,一些技术会增加总体训练时间),而是为了减少模型评分时间。 未完待续......
零基础入门金融风控 - 贷款违约预测比赛方案分享 - Rank9 使用Catboost 模型 因为本身比赛object比较多,对类别进行排序赋值 ,对时间进行提取,年月日,三类提取,cat会自动交叉。 进行特征工程分部,构造年收入 月收入等,然后对FICO进行编码,fico越高 违约率越低 。 使用groupby 来看违约率。 对时间格式进行处理 for d...
现附上比赛链接天池学习赛贷款违约预测.https://tianchi.aliyun.com/competition/entrance/531830/introduction。 本次分享内容普遍适用于数据挖掘,金融风控比赛,相应长期赛刚刚开始,希望能给大家一点启发。因数据较大,没有上传,需要可以私聊我邮箱发送。核心代码见model文件夹下的ipynb文件,user_data,feature文件夹负责...
天池比赛_金融风控_贷款违约预测.zip素年**凉音 上传145KB 文件格式 zip 天池比赛_金融风控_贷款违约预测 点赞(0) 踩踩(0) 反馈 所需:1 积分 电信网络下载 基于Matlab界面面板版的卡尔曼小球运动跟踪[Matlab界面面板版].zip 2025-02-06 19:18:09 积分:1 基于Matlab界面面板版的交通标志识别[Matlab界面...
零基础入门金融风控-贷款违约预测赛题与数据-天池大赛-阿里云天池 数据字段说明 赛题理解 本赛题属于分类问题,通过一系列数据最终判断用户是否会违约 模型评估方法 本此使用的评估方法是使用AUC评估模型效果(越大越好)。 对于分类模型的评估,还有更多的评估方法,具体可以参考:机器学习之分类模型评估总结 ...