一幢山一片海 发表于 2014-8-18 09:38 
没有关系的,呵呵。有两个问题想向你请教:1,我们一般在什么时候可以添加交互项呢?2,添加交互项会不会由 ...
1.加入交互项一般都是有分类变量存在,或者是分类变量和分类变量,或者是分类变量和连续变量。一般思想就是“分组”。比如想这篇文章里面,迁移与非迁移,以及父亲收入。那么我们做交互时候,讨论的话,就是父亲的收入在迁移组以及非迁移组区别。 换个例子,男性女性的受教育程度对于收入的影响,教育回报的问题。交互的时候,收入水平在男性组随着教育程度增加会怎样,随着女性教育程度增加会怎样,如此。如果把教育程度换成高中低的序次分类变量,同样也可以,这样产生了六个组(三个对照组):男低,男中,男高;女低,女中,女高等。分析师侯同样是按照这个逻辑去解释。
个人感觉:交互项的解释其实更多是一种技巧性的安排,并不是特别难懂。
2.加入交互项会不会产生多重共线性。
这个担心是很正常的,不过不用担心这个问题。从解释力度来讲,交互效应是比主效应要弱很多的。我们一般都是在考虑完主效应才考虑交互效应。主效应不显著,交互效应是没有意义的。
另外,楼主也可以了解下多重共线性发生的机理,一般而言,是主效应里面的几个变量发生了共线,而且可能是发生了相互解释或者干涉,这个可以通过协相关矩阵检查出来,然后再看容忍系数。
一句话:交互效应是不会对主效应造成共线性问题的。