全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
15281 10
2011-01-26
做二元逻辑回归模型的时候
如果样本量应变量0和1很不对称
比如0有300来个,1有3000来个
会不会影响预测的结果
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2011-1-27 08:49:08
如果发生或不发生的概率极小应用泊松回归(poisson regression), 不过你的300:3000=1:10还好一般logistic regeression 就行了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-1-27 12:03:39
感谢ls的,但我试过,如果复制样本量少的数据,将0的数据增大
会影响分析结果

这个怎么办,要不要增大样本0的数据
因为我发现增大样本量后的结果比较符合我们对业务的分析,比较贴近实际
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-1-28 14:12:40
比如做客户流失预警,正样本的数量过低的话,可以适当的减少负样本的数量。
还可以分别以1:5—1:10之间进行尝试!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-1-28 14:22:27
复制0样本的数据?这个不能做的,这相当于自己造数据改变样本,即使造的数据来自于与样本中的一部分,也是你有选择性的操作 3# satellite111
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-1-30 23:29:13
复制0样本的数据不行的话?

那么上面提的减少1样本的方法不知可行否
要不模拟0样本的数据?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群