全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
6945 9
2015-01-31
我做了一个二分类变量的logit回归
分类变量例如年龄,收入这些转为了哑变量,按照10岁,或者1000为一个梯度来进行重新编码
回归出来的correlation matrix里面年龄之间出现了相关性,例如20-30岁的与30-40岁的相关,因为一个是1,一个是0;一个人是20多岁肯定就不是30多岁
同样的,收入也出现了相关,相关性系数0.7左右,这估计不行把

该怎么解决呢?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-1-31 18:04:09
不明白你说的啥,哑变量编码?编码有问题?编码共线性问题?
哑变量共线,可以尝试中心化
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-1-31 23:36:00
用forward  LR 结果就是排除共线性后的结果
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-2-1 09:39:06
zlgsx 发表于 2015-1-31 18:04
不明白你说的啥,哑变量编码?编码有问题?编码共线性问题?
哑变量共线,可以尝试中心化
多谢回答指点!
哑变量比如:年龄,20-30,;30-40;40-50;50-60发生共线,20-30与30-40相关系数是0.7
这个该怎么处理?也是中心化吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-2-1 09:52:32
gxnnhsd 发表于 2015-1-31 23:36
用forward  LR 结果就是排除共线性后的结果
果然LR比Wald出来的结果共线性小,不过Wald的结果更好怎么办呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-2-1 10:11:46
自变量哑变量化后变成k-1个哑变量,这K-1个哑变量间的相关性没有意义  因为他们实际上还是表示同一个变量


拙见仅供参考哈
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群