关于一个国家A事件和B事件的发生,有4种情况:
A发生,B发生,AB都发生,AB都没发生。
现在我用了两种设定虚拟变量的方法:
第一种是:设定2个虚拟变量和一个交互项:
D1:A发生为1,D2:B发生为1,D1*D2为交互项(两个都发生了才取1)。
第二种是直接设定3个虚拟变量:
D1:A发生为1,D2:B发生为1,D3:AB都发生了为1.
这样造成的区别是,如果一国是AB都发生的情况,
采用第一种方法得出的变量为:1 1 1
采用第二种方法得出的变量为:0 0 1
回归结果是,
第一种方法:D1不显著,D2显著,交互项不显著,
第二种方法:D1不显著,D2显著,D3显著。
但是我觉得这样做出来应该只是系数解释上的不同,
为什么显著性也会不同呢?
这个虚拟变量应该怎么设比较合理?
求大神帮忙!!