交叉项是指两个变量联合解释,单独变量解释时会存在很明显的偏误,通过增加交叉项来降低该变量的偏误,以及防治单独变量错误回归时地错误解释。
考虑reg y a 和reg y a ab 其中y是成绩 ,a是听课时间, b是不认真程度,第一个回归可以得到y和a应该正相关,第二个回归能得到y与a正相关,但与ab负相关。若只考虑第一个回归,那我们就错误地得出结论听课时间越长成绩越好,其实考虑第二个回归就能发现成绩不仅和时间有关还与认真度有关。
一般交叉项用于定量变量(数量级,多少个)和定性变量(表示程度或者性质)之间的组合,比如最简单的性别问题,就可以在原解释变量上乘以一个性别地虚拟变量。
关于交叉项,学得不精,楼主酌情学习吧。