全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
8785 8
2014-07-26
在线性模型中涉及多个变量都是分类变量的情况:
y:数值变量
x1:数值变量
x2:数值变量
x3:分类变量,比如有A, B, C三个类
x4:分类变量,比如有P, Q, R三个类

我做了线性拟合,
res <- lm(y~ x1 + x2 + x3 + x4)
summary(res)
结果仅仅出现x1, x2, x3B, x3C, x4Q, x4R
那么x3A, x4P跑哪里去了?是不全融入到了Intercept中了?
如果是融进去了,那么如何区分x3A, x4P影响是否显著呢?

谢谢大家讨论和指导!
看后请思考后回复,不管是否正确,以供讨论。再次感谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-7-27 03:52:04
楼主可以试试如下的修正:
res<-glm(y~ x1 + x2 + as.factor(x3) + as.factor(x4))
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-7-27 14:43:01
x3B, x3C是与x3A比较的结果,x4Q, x4R是与x4P比较的结果。
不知道楼主说的“x3A, x4P影响是否显著”究竟是什么意思。如果要看x3、x4这两个因子是否有影响,试试summary.aov(res)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-7-28 23:17:18
mymei 发表于 2014-7-27 14:43
x3B, x3C是与x3A比较的结果,x4Q, x4R是与x4P比较的结果。
不知道楼主说的“x3A, x4P影响是否显著”究竟是 ...
非常感谢!我想我是明白了。我的问题是p, Q, R如果代表三类,想看看那个影响更大一些,如何才能看出啦呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-7-29 08:37:16
说影响的话需要有个对照。如果分类变量只包含P、Q、R三个值,没法问这三类哪一类的影响大,因为不知道基准在哪。如果要比较这三类之间的差异,可以用多重比较,参看TukeyHSD函数。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-7-29 08:58:50
学习了,多谢。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群