全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
363 0
2024-03-17

三方数据,一般是指外部第三平台依靠长期业务积累然后形成的具有自己特色的进行加工处理过后的数据,常见的有多头借贷的数据,支付数据,信用评分类等数据类型。

三方数据在贷前会发挥着最重要的作用,当一个客户来申请贷款的时候,如果来判断这个客户好和坏呢,除了需要金融机构自己的数据,另外就需要庞大的外部数据。

那么我们要从哪些方面去评价三方数据呢?


如何评价三方数据

三率:覆盖率、缺失率、准确率

三性:相关性、预测性、解释性

三度:区分度、重要度、稳定度

三率

覆盖率:已匹配样本数量/分析总样本数量

缺失率:特征缺失值样本数量/分析总样本数量

准确率:验证一致样本数量/分析总样本数量

三性

相关性:特征相关性person,spearman系数等

预测性:特征对目标变量的信息贡献度指标IV

解释性:特征分布趋势与实际业务理解是否匹配

三度

区分度:模型区分度指标KS,AUC,GINI等

重要度:特征重要性系数,importance(决策树)

稳定度:特征在不同样本的分布稳定性PSI


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群