全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
8783 7
2017-02-04
最近在转风控的研究,由于之前不是做这一块的,也接触R很少,啃的比较吃力,故而请教各位老师指点。在看到要导入数据时,需要进行分箱,在一篇文章中看到“监督离散化(supervised discretizaion),使用递归划分(Recursive Partitioning)将连续变量分为分段,背后是一种基于条件推断查找最佳分组的算法(Conditional Inference Tree)”用的是smbinning进行分组。而在另外一篇文章中看到,“smbinning其理论基础是构造条件推断树ctree(conditional inference trees),并把ctree树节点当成bin的分割点。此函数对于连续变量的分bin效果比较好,而对于离散变量分bin就不尽人意了,往往会出现“No Bins”或者只分两三bin的情况。”所以先用0-1背包对数据进行了分bin,效果比smbinning要好,不知R中是否有对应程序包?
另外,在其他文章中,也看到了用mdlp的方法,不知smbinning和discretization的mdlp有什么区别吗?感谢!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-2-5 18:17:01
自己顶。。。求解答。谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-3-30 15:57:21
楼主留个联系方式啊
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-8-27 21:32:03
现在也遇到分箱问题了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-9-18 19:04:29
楼主,问题解决了没?求分享,我也在做风控
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-11-28 17:33:37
binzhang8867 发表于 2017-2-5 18:17
自己顶。。。求解答。谢谢!
请问您之前说的用0-1分bin的问题解决了吗
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群