经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
R语言论坛
求助,评分卡模型多变量分箱!
楼主
wallacebyron
4093
3
收藏
2018-02-27
RT!建信用评分卡模型,要进行变量分箱,有几百个变量,如何对每个变量进行快速分箱!求助!!
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
jameschin007
2018-2-27 20:17:13
变量多,就要先做特征选择,去除无效变量,然后再分箱
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
菊花冰糖水
2018-3-1 15:57:44
可以先使用 LR,随机森林或者决策树做特征选择,去除无效变量。再根据连续型或者离散变量进行分箱。做评分卡没有什么取巧的方式,变量分箱是 计算 WOE 和 IV 的重要环节,而且很多时候分箱也依赖于业务逻辑和业务数据。只有多花时间把这部分做好,你的评分卡才有用啊。所以没有所谓的“快速”自动分箱
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
板凳
路遥的遥
2018-3-29 14:19:20
smbinning,或者卡方分箱
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
栏目导航
R语言论坛
数据分析师(CDA)专版
Stata专版
金融学(理论版)
金融实务版
计量经济学与统计软件
热门文章
精准匹配,菁英相伴--经管之家单身俱乐部, ...
科研时间70%耗在“下载-复制-粘贴”?零代码 ...
我该如何记住你?智能体记忆系统的演化之路
CDA数据分析脱产就业班于2026年3月7日开班! ...
CDA 认证考试大纲 2025 重磅更新:一二级考 ...
表格结构数据的核心特征及具象实例解析
伍德里奇计量经济学导论第六版教材PDF
2026年Agent领域十大趋势判断
湖南统计年鉴2025(Excel版)
中外历史年代对照表
推荐文章
2026JG学术冬训营:从Stata初高到Python机器 ...
【必看】【本版版规,欢迎发悬赏贴求助】
26年寒假天津站|Gemini论文写作&数据分析 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群