全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
7847 5
2017-10-10

混迹在各个论坛和学习贴有小一年的时间,使用SAS软件开发金融行业的评分卡模型也有一年多的时间,现在就在论坛里做个经验的分享。评分卡模型分为A卡(申请)、B卡(行为)、C卡(催收),对于贷款的不同阶段有不同的评分卡模型,今天就先来说说A卡(申请评分卡)。
直接主题:
开发流程:
1、评分卡模型的可行性研究
首先你要对开发评分卡的贷款产品有一定的业务了解,大致有以下几个维度
1)产品现状(产品的每月通过量、逾期率)
2)产品Vintage、Roll Rate
3)可选变量的IV效用
当然如果是你boss下达的任务,那可行性调研也就那么回事了

2、数据准备
1)开发评分卡所需数据的准备是最最花时间的,包括公司内部的数据和接入的第三方外部数据,需要进行数据的异常处理、数据的清洗以及造衍生变量,这个过程就需要对业务逻辑有一定的了解,包括通过第三方数据创造衍生变量;
2)确定训练样本和验证样本以及Y
样本的确定有很多因素,比如客群变化的因素,当然就是时间越近越好;样本量的大小;Y的定义是最好能有一个比较好的表现期,但消费金融公司往往Y的表现期不够长,那就考虑Y的转化率比较高同时坏样本能更多的覆盖到坏客群的特征;
3)挑选入选模型变量
可以使用IV遍历排序,然后选取排序较高IV的变量,但也要考虑变量的业务定义,比如有些变量如百融的收入变量虽然确实比较大,但因为变量对于bad or good客户的区分能力比较强,所以也要考虑为入选变量

3、WOE转化和Logistic建模
对准备好的变量数据进行离散化WOE转化,进行多重共线性检验,跑Logistic模型并且对模型结果进行效用分析,最后进行分数的转化,输出模型变量的分组区间以及相应的权重

4、模型的验证
利用验证数据去校验模型的效用,比如KS、LIFT、GINI、PSI等指标,输出模型变量分组的通过率以及逾期率的分布曲线,保证模型具有准确性、较好的区分能力以及稳定性

至此,模型开发已经大致结束,后续需要对开发的模型进行测试、上线以及上线后的模型监控。

今天就先分享到这里了!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-10-11 03:30:20
分析的挺不错的,比较到位了,几乎涵盖了申请评分卡建模的大致流程,如果可以更加细致的讲解下筛选变量还有WOE转化这块就做好了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-1-2 11:10:44
楼主有讲评分卡模型的视频么?能不能发我一份,可以出钱购买
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-4-20 14:06:42
能不能结合SAS代码做一下呢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-4-21 10:04:00
ly1977907806 发表于 2018-1-2 11:10
楼主有讲评分卡模型的视频么?能不能发我一份,可以出钱购买
我发你
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-4-21 10:05:03
人脉引爆点 发表于 2020-4-21 10:04
我发你
http://www.peixun.net/view/1409.html
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群