全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
11593 6
2013-06-29

回归模型因子变量与连续变量交叉项的问题

在回归模型中引入因子变量与连续变量的交叉项,但发现连续变量的main effect不再显著,所以变为只考虑因子变量的main effect以及两者的interaction effects。查阅资料得知R中交叉项的引入可以用星号(*)也可以用冒号(:),但是后者前者自动包含了main effect interaction effects,但是后者就只有interaction effects,所以这里我用了冒号。但是在回归分析结果中发现交叉项中涉及的因子变量的水平并不一样,如果用星号,则是(总水平数-1),而如果是冒号,则是总水平数,而且交叉项中变量的先后顺序也有不同,不知道两个模型的区别在哪里?

案例代码和数据如下(请大家忽略实际意义),理论上来讲,两个模型的差别在于glm_colon模型中,包含了因子变量attmain effct,但是没有包含连续变量handmain effect,但是实际的结果却发现交叉项中涉及的att的水平也有所不同,glm_star只有4个水平,而glm_colon却有5个。不知道是什么原因?

test <- read.csv("test.csv")

head(test)

str(test)

test$att <- factor(test$att)

glm_star <- glm(formula = sex ~ hand * att, data = test,family=binomial)

glm_colon <- glm(formula = sex ~ att + hand : att, data = test,family=binomial)

summary(glm_star)

summary(glm_colon)


测试数据请移步:https://bbs.pinggu.org/a-1352379.html

想上传文件的,但是论坛总提示文件已存在,上传失败,只好麻烦各位了,谢谢!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-6-29 17:44:58
glm_star模型的结果是:
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-6-29 17:45:44
glm_colon的结果是:
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-6-30 01:38:51
没太搞明白lz的main effect 和 interaction effects的区别,是不是main effect为由某因子引起的效应,而interaction effect是各个因子所综合引起的交互效应呢?而且因为glm_star模型把两者都考虑进去了所以其水平比后者小1,因而其自由度大1.不知道是不是可以这么个理解。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-6-11 12:41:13
六年过去了,请问楼主知道为什么了吗?因为我也在纠结这问题……

不过根据lm里的说明:

A specification of the form first:second indicates the set of terms obtained by taking the interactions of all terms in first with all terms in second. The specification first*second indicates the cross of first and second. This is the same as first + second + first:second.


我猜是不是因为*是交叉项,而:是前项数据中所有terms和后项数据所有term做交叉
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-6-11 12:42:40
Call:
lm(formula = a62 ~ a69 * a2, data = a)

Coefficients:
       (Intercept)             a69同居       a69初婚有配偶       a69再婚有配偶  
           71640.0            -39890.0               932.6             -1400.0  
     a69分居未离婚             a69离婚             a69丧偶                a2女  
          -11640.0             41693.3            -24268.6            -10256.8  
      a69同居:a2女  a69初婚有配偶:a2女  a69再婚有配偶:a2女  a69分居未离婚:a2女  
          171840.1             10640.0            -11411.8                  NA  
      a69离婚:a2女        a69丧偶:a2女  
          -59076.6              5463.1  



Call:
lm(formula = a62 ~ a69:a2, data = a)

Coefficients:
       (Intercept)        a69未婚:a2男        a69同居:a2男  a69初婚有配偶:a2男  
             42578               29062              -10828               29995  
a69再婚有配偶:a2男  a69分居未离婚:a2男        a69离婚:a2男        a69丧偶:a2男  
             27662               17422               70756                4794  
      a69未婚:a2女        a69同居:a2女  a69初婚有配偶:a2女  a69再婚有配偶:a2女  
             18805              150756               30378                5994  
a69分居未离婚:a2女        a69离婚:a2女        a69丧偶:a2女  
                NA                1422                  NA  
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群