最近在用interaction term做论文,查了很多文献和帖子,有了一些心得,特地总结下来供大家参考。
先贴上来一些reference和链接(也已附在附件中供大家下载)
1.
Understanding Interaction Models: Improving Empirical Analyses https://files.nyu.edu/mrg217/public/pa_final.pdf
2.
Misleading Heuristics and Moderated Multiple Regression Models
http://dx.doi.org/10.1509/jmkr.38.1.100.18835
3.
Negative Consequences of Dichotomizing Continuous Predictor Variables
http://dx.doi.org/10.1509/jmkr.40.3.366.19237
4.
Continuous Variables :Analyzing and Interpreting Interaction Models
http://www.myscp.org/pdf/ModerationSCP.pdf
文献1从理论上解释了如何使用interaction term:
(1)必须必须加入所有构成变量(Include all constitutive terms):如interaction term是XZ,那么X和Z都必须纳入回归。
文章详细解释了有文献以某一构成变量对被解释变量无影响(如X对Y无作用),或者某一构成变量在某特殊点对被解释变量无影响(X在Z为0时对Y无作用)为用少纳构成变量,这些理由都是站不住脚的。文章从理论上清晰的解释了这一点。
(2)正确解释interaction terms与constitutive terms的系数(Do Not interpret constitutive terms as unconditional marginal effects):
比如形如 Y = b0 + b1X + b2Z + b3 XZ + e 的模型:
b1 仅能解释为当Z为零时,一单位X的变动对Y造成的影响。
b2 仅能解释为当X为零时,一单位Z的变动对Y造成的影响。
而一单位的X的变动对Y造成的影响应该是b1 + b3 Z;
而一单位的Z的变动对Y造成的影响应该是b2 + b3 X.
(3)注意边际效应和标准差也都要相应改变(Do not forget to calculate substantively meaningful marginal effects and standard errors):
也即是说在上述模型中,即使b1和b2都显著,也并不能说明X和Z对Y有显著影响,反之相同,即使他们都不显著,也不能说明他们对Y没有显著影响。上述Interaction term的模型是为了检验X对Y的作用有没有收到Z的影响,或者Z对Y的作用有没有收到X的影响,而不是用来检验X或者Z他们分别对Y有没有影响。
所以,如果想要检验X或者Z他们分别对Y有没有影响,应该在base regression中去掉interaction term来进行检验。
若说的不对,还请大家多多指正。
明天再来更新其他文献的总结。
以下是参考文献,供大家下载: