全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
30262 6
2015-04-13
小白一枚,程序比较低能……放在最后了。
大概思路是:自变量有11个,都是数值型的。1值的样本是固定的,从900个0值中抽取等量的数据进行逻辑回归。因为样本量比较小,所以做了100次重复抽取,计算回归系数的95%置信区间和显著次数。


然后好几个样本就警告了:
Warning messages:
1: glm.fit:算法没有聚合
2: glm.fit:拟合機率算出来是数值零或一
结果就是回归结果特别飘忽不定,无法得到稳定的回归系数TT

怀疑是自变量多重共线性,计算了kappa值,如下图。
数据都不怎么好,这是抽样100次的结果,只有samp3的均值在100以下,而高亮的是回归后出现多次不聚合或P=1的样本,好像没有直接关系啊,kappa值高的也有能聚合的,kappa值低的也有不聚合的><
另外,查到说共线性可以用step逐步回归解决的,但是尝试后发现结果还是不聚合啊吐血……
kappa.jpg

所以想问一下:
1、出现不聚合和拟合概率为0或1的情况,原因是什么?
2、多重共线性应当如何处理?扩大样本量是不现实了,如何判断哪个因子共线性高从而剔除之?
3、感觉11个因子太多了,如何进行模型的筛选和优化?


跪谢!


附上低能程序(好羞耻><)
复制代码




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-4-13 17:39:54
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-4-13 17:59:58
as分发给 发表于 2015-4-13 17:39
看连接https://bbs.pinggu.org/thread-3662074-1-1.html
唔,是不是复制错链接了……
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-4-13 18:02:18
https://bbs.pinggu.org/forum.php?mod=viewthread&tid=3651818&page=1#pid29530110
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-4-14 14:42:13
as分发给 发表于 2015-4-13 18:02
https://bbs.pinggu.org/forum.php?mod=viewthread&tid=3651818&page=1#pid29530110
买不起
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-4-15 20:48:24
求解答><
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群