研究过程中,有三种类型的变量常常纠缠在一起,让研究者困惑,这三种变量就是中介变量、抑制变量和混淆变量,下面简要介绍一下三种变量。
中介变量(Mediator)是联系两个变量之间关系的纽带,在理论上,中介变量意味着某种内部机制(MacKinnon, 2008)。自变量X的变化引起中介变量M的变化,中介变量M的变化引起因变量Y的变化。例如,某种治疗癌症的药物(X)需要通过特定的酶(M)才能有效杀死肿瘤细胞(Y),如果体内缺少这种酶,药物的作用将失效。可见中介变量是参与整个因果过程中的重要一环,不可或缺,正因为如此,中介效应分析的前提是变量间存在明确的(理论上或事实上的)因果关系(Baron & Kenny, 1986; Kenny et al., 1998;MacKinnon et al., 2002),否则结果很难解释。
抑制变量(suppressor)指将其纳入回归方程后将增加自变量和因变量之间回归系数的变量(Conger, 1974)。换句话说,自变量和因变量之间关系受到第三个变量的抑制,如果不控制该变量,自变量和因变量之间的回归系数将变小或得到相反的关系(Cohen & Cohen, 1983)。
在中介模型中,当直接效应和间接效应有着相反的符号时表现为抑制效应(Cliff & Earleywine, 1994; Tzelgov & Henik, 1991),此种情况也称作不一致的中介模型(Inconsistent Mediation Models, Davis, 1985)。具体来说,图3-6中a和b的符号为正,c’的符号为负,ab和c’符号相反,此时即出现抑制效应或不一致的中介效应(中介效应与直接效应相反)。
混淆变量(Confounding Variable)是指与自变量和因变量均相关的变量,该变量使自变量和因变量间产生虚假的关系(Meinert, 1986)。例如,年龄混淆了年收入和罹患癌症几率之间的关系。随着年龄增加,年收入增加,同时患癌症的几率增加,年收入与癌症之间的关系完全是由年龄造成的。这种情况经常用来解释相关不等于因果关系,因为可能存在第三个变量同时影响两者。
中介变量、抑制变量与混淆变量在概念上存在明显的区别但在统计检验上又非常相似,中介效应的点和区间估计稍加修改后可用于抑制效应和混淆效应的估计上,关于三者更多的信息可参见MacKinnon等(2000)。
MPLUS第二期工作坊:http://blog.sina.com.cn/s/blog_7fb03f7d01014f9q.html