全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
4093 3
2018-02-27
RT!建信用评分卡模型,要进行变量分箱,有几百个变量,如何对每个变量进行快速分箱!求助!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-2-27 20:17:13
变量多,就要先做特征选择,去除无效变量,然后再分箱
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-3-1 15:57:44
可以先使用 LR,随机森林或者决策树做特征选择,去除无效变量。再根据连续型或者离散变量进行分箱。做评分卡没有什么取巧的方式,变量分箱是 计算 WOE 和 IV 的重要环节,而且很多时候分箱也依赖于业务逻辑和业务数据。只有多花时间把这部分做好,你的评分卡才有用啊。所以没有所谓的“快速”自动分箱
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-3-29 14:19:20
smbinning,或者卡方分箱
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群