回归方程中采用两个虚拟变量D1和D2,回归结果两个虚拟变量的系数统计上都显著,考虑到两个虚拟变量可能存在交互效应,在方程中加入了第三个虚拟变量D3=D1*D2,
数据1:回归结果D1和D2的系数统计上不显著,D3的系数显著。
数据2:回归结果D1的系数显著,D2的系数统计上不显著,D3的系数显著。
如何解释这种现象,谢谢
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
我检查了数据,但似乎多元共线性不存在,请各位帮忙解释一下
又遇到一个问题:
一个特征变量有三种状态,选三个虚拟变量D1、D2和D3做回归,无截距项,回归结果三个虚拟变量的系数统计上都显著。
改变回归方程,只包含其中两个虚拟变量D1和D2,或D2和D3,或D1和D3,含截距项,回归结果显示截距项统计上都显著,而任意两个虚拟变量的系数统计上都不显著。
这是为什么,理论上讲结果应该是同质的,请各位大侠帮忙
解释是不一样的
第二种情况,比如是两个虚拟变量D1(小学)和D2(初中),这时候是以D3(高中)作为基准进行比较的
D1的系数是指上小学的人与上高中的人之间是否存在差异;
D2的系数是指上小学的人与上高中的人之间是否存在差异;
第一种情况
D1的系数是指上小学的人与非小学的人是否有差异
所以显著性是不一样的
但是这两种方法的系数是有一定关系的。