全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
12412 6
2013-07-23
做逻辑回归时,要对分组性变量进行分组,但是分完组后的的WOE值不是单调的,这样的分组,能用吗,?例子如下:[td]
TmAtAddress_b C1 C0 WOE Inf_Value
1 19 24 0.47 0.00846
2 286 621 -0.07092   0 .003755040
3 89 146 0.20945  0.008872891
4 3 12 -0.68188 0.005037212

TmAtAddress 分成了4组,C1是1的个数。C0是0的个数,



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-12-13 13:43:47
发现很多人虽然在用woe,但没有实际理解。
WOE不一定都要单调,业务长能解释通就行,譬如存在U型,中间的年龄段对Y越强。
有些从业务上解释,需要单调,但目前分组后的woe没有单调,要么重新分组重新计算woe,如果都不行,说明该变量没有变现出可以用logistic回归的合理解释,应该拒绝该变量。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-12-14 13:56:57
分组不合理造成的,我看了一下,你的分组不合理,有一组少于5%
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-11-9 17:21:31
楼主你问题解决了么?  从woe分箱结果需要单调引出思考,是否应用logsitic回归的时候,都应该需要输入变量和目标的概率比 是单调关系 才是比较适合模型的呢? 假如并不单调,是不是一个干扰的输入变量呢,是否该将此变量直接剔除?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-11-9 18:40:44
我倒是想求助楼主那个IV值是怎么算出来的。。。我一直都算不出来。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-11-11 15:19:24
woe本身就不一定是单调的,如果与实际情况不一致的话就要考虑是样本和分段的问题 了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群