这个问题也在许多书中、贴中见过,例如Y=c + a1*X1 + b1 * X2 + d1* X1 * X2。那么,在引入X1 * X2时,必须引入X1和X2的单项进来,否则估计结果有偏。
但是近来看见好几篇全文论文(JBF的两篇、Oxford Bulletin of Economics and Statistics 71的一篇,均为国际比较权威的期刊),都直接把交叉项引入进来了。但是这三篇文章共同点是引入的交叉项都是虚拟变量的,例如X1为连续变量,X2为虚拟变量,则直接写为:
Y=c + a1*X1 + d1* X1 * X2
所以,本人想问,是否当X2为虚拟变量时,可直接引入交叉项,不必包含X2自身项?