全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
31899 17
2015-10-27
有一个自变量为4分类变量,设置虚拟变量为D1,D2,D3。采用进入法将所有变量纳入回归,分析结果显示D1的系数没有通过t检验,P>0.05,但是D2,D3均通过检验,这样子的结果虚拟变量应该怎么解释呢?
假设4分类变量为4个品种:1、2、3、4。以品种1为参照,设置3个虚拟变量D1,D2,D3。我个人认为如果虚拟变量中有一个(D1)不通过t检验,说明3个虚拟变量所代表的品种这个4分类变量对因变量的影响均不显著,即品种对因变量无显著相关性,这样的分析对不对?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-10-27 13:40:57
自己顶起来
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-10-28 16:11:13
   第一个问题:类别变量有4类,处理为3个虚拟变量了。SPSS一般默认以最高组为参照组,假设其为4,那么在解释时这样说:与参照组相比,D2,D3比其多/少xx(这里的xx表示偏回归系数。其中,偏回归系数为正则表示比参照组多xx;偏回归系数为负则表示比参照组少xx)。
   第二个问题不对。D1与参照组比差异不显著那只表明D1与参照组间无显著差异。而D2与D3若通过t检验,那么D2和D3则与参照组差异显著。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-10-28 16:35:26
xddlovejiao1314 发表于 2015-10-28 16:11
第一个问题:类别变量有4类,处理为3个虚拟变量了。SPSS一般默认以最高组为参照组,假设其为4,那么在解 ...
非常感谢参与讨论!个人的理解:虚拟变量的设置以某一个为参照的意思应该是说D1-D3取值均为0表示品种A,以此为参照;D1=1,D2、D3为0代表为品种B,D2=1,D1、D3为0代表品种C;D3=1,D1、D2为0代表品种D。此时的参照我理解应该是设置虚拟变量时仅作为一个赋值的参考,而比较时应该不是D1-D3的虚拟变量与参照之间比较吧,应该是要整体分析D1、D2、D3所代表的这个分类变量对因变量y的影响吧。因为D1、D2、D3分别取值000,100,010,001才能代表一个变量,分开就没有意义了,也就没有必要采用进入法,把虚拟变量强行纳入模型了吧。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-10-28 16:39:40
a42325913 发表于 2015-10-28 16:35
非常感谢参与讨论!个人的理解:虚拟变量的设置以某一个为参照的意思应该是说D1-D3取值均为0表示品种A,以 ...
类别变量有4个类别,设置了一个参照组和3个虚拟变量,如果分开写回归方程那就有3个了。所以解释的时候D1,D2,D3分别与参照组比怎样怎样,而不是再将其作为一个整体变量考虑了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-10-30 17:34:56
xddlovejiao1314 发表于 2015-10-28 16:39
类别变量有4个类别,设置了一个参照组和3个虚拟变量,如果分开写回归方程那就有3个了。所以解释的时候D1, ...
又仔细的看了几天虚拟变量的内容,总算是弄明白了,果然是虚拟变量,虚的都不好理解了,终于画图看结截距看出了点儿名堂。。。还是很感谢大神的解答的,以后多交流哈
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群