全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
12113 5
2017-12-07
如题,glm建模之后用测试集进行预测,发出的Warning message。所以这个到底是什么意思?原因是什么?希望明白的朋友帮忙解答。感谢感谢~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-12-7 18:36:30
R里面的吧,应该是存在强相关的自变量,也就是设计矩阵非满秩的,会导致这样的结果,也有可能是你的target是线性可分的,用线性回归就好了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-12-7 18:47:40
阿扁V5 发表于 2017-12-7 18:36
R里面的吧,应该是存在强相关的自变量,也就是设计矩阵非满秩的,会导致这样的结果,也有可能是你的target是 ...
感谢回复。
自变量大部分都是分类变量,所以赋值的话可能有很强的相关性?
以及 我的y是count data,有什么建议的可用的方法么?
谢谢~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-12-7 21:03:49
浅夏问路 发表于 2017-12-7 18:47
感谢回复。
自变量大部分都是分类变量,所以赋值的话可能有很强的相关性?
以及 我的y是count data,有 ...
自变量是分类变量本身没有问题,先检验相关性吧,去掉强相关的,你的y是countdata不太懂是什么意思?难道是计数而不是分类变量?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-12-8 09:36:32
阿扁V5 发表于 2017-12-7 21:03
自变量是分类变量本身没有问题,先检验相关性吧,去掉强相关的,你的y是countdata不太懂是什么意思?难道 ...
我的因变量是计数型数据 所以最初没有想使用ols 检验了下均值和方差之后想用负二项回归试试
另外我还有个问题想请教你一下:我的自变量大部分都是分类变量,有序的自变量赋值成numeric的,那么那些本身无序的分类变量如果赋值的话本身其实没有什么意义,那如果检验他们之间的相关性的话还有意义么?
谢谢~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-12-8 11:02:49
只能是计算gini或者信息熵这样针对离散型数据的指标
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群