在多重线性回归中,许多人都会碰到这样的情形:单因素分析有统计学意义,而多因素分析则无统计学意义了。这种情况令很多人头疼,不知道到底该相信哪一个结果。今天就这种情况进行以下阐述,使大家对此有些了解。比如,描述身高、体重对血压的影响。单因素分析也就是分别做身高对血压、体重对血压的影响分析。结果显示身高和体重对血压的变化都有影响。多因素分析就是将身高、体重同时做对血压的影响分析,结果发现身高对血压的影响无统计学意义了,体重对血压的影响有统计学意义。首 先需要明白,单因素分析中,自变量对因变量的影响,不仅仅反映自变量本身的作用,由于自变量之间一般存在一定的相互作用,因此,自变量的作用还包含了其它 因素的间接作用或交互作用。比如上述的例子,单因素分析中,身高对血压的影响,不仅反映了身高的影响,还有体重的影响。同样,体重对血压的影响,也不仅仅是体重的单独作用,还有身高的间接作用。
而多因素分析中,自变量对因变量的作用是扣除了其他变量的影响后的作用,比如上例,多因素分析中,身高对血压的影响,反映的是扣除了体重的作用后,身高对血压的“纯”作用。同样,体重对血压的影响,反映的是扣除了身高的作用后,体重对血压的“纯”影响。实际分析中,还可以通过标准化偏回归系数(standardizedpartial coefficient of regression)还比较到底哪个因素对因变量的作用更大。通常,各个自变量之间的单位是不同的,比如身高是cm,体重是kg,二者无法比较作用大 小。而标准化系数则将它们都转化为无单位的系数,这样就可以直接比较对因变量的影响大小了。