我在做回归分析的时候遇到一个问题,想向大家请教。
假设我用一些自变量解释因变量y
(y=a0+a1x1+a2x2+...+anxn,模型1)
最后得到的结果是x1(如非农收入比重),x2(如ZF补助)与y1显著相关(p<0.01)。
我的指导老师希望我对样本进行分组,分为参与非农产业与未参与非常产业,然后对两个子样本分别进行回归分析。他想考察参与非农产业与不参与非农产业的情况下,x2对y的解释力是否有差异。
得到两个模型:
参与非农产业的样本(样本2)
y*=a0*+a2*x2*+...+an*xn* (模型2)
不参与的样本 (样本3)
y‘=a0’+a2‘x2’+...+an‘xn’ (模型3)
结果模型2里,x2与y之间显著相关,模型3里二者并不相关。
我的指导老师就说这是因为,x2与y之间之所以显著,就是因为在样本2里二者有显著相关关系。对于不参与非农产业的样本,x2与y之间并无关系。
因为我对统计知识一无所知,所以上来向大家求助。我的指导老师的说法对吗?
出现这种结果还可能是什么原因?或者怎样理解这种现象?
期待您的回复,谢谢