因子分析的基本逻辑是如果变量之间有强相关,则在这些变量背后可能存在共同的影响因子(所谓公因子),因此,因子分析在计算上的起点就是相关系数阵(也可以是协方差阵),显然,相关系数阵对角线上的元素为1,非对角线上的元素表示变量两两之间的相关系数,其绝对值在0-1之间,越接近于1,数据集越适合做因子分析;越接近于0(相关系数阵近于单位阵),数据集越不适合做因子分析。
Bartlett球形检验的原假设是:相关系数阵为单位阵(即,不适合做因子分析)。根据相关系数阵计算得到的Bartlett统计量近似服从卡方分布,因此可以根据卡方值和自由度查表卡方值表来判断是拒绝还是不能拒绝零假设。因为自己查表很麻烦,所以统计软件一般都会直接提供显著性(sig.值),根据sig.值,与α值(一般取0.05)比较,如果低于0.05,则拒绝零假设,即相关系数阵不是单位阵,也即数据集适合做因子分析。
KMO测度,是比较变量的相关系数与偏相关系数,通过计算二者平方和之差来进行比较,其逻辑是,如果变量背后有共同的影响因子,则变量间的相关系数应该很大,而偏相关系数应该很小,因此KMO测度值应该越大越好。KMO测度的值域是0-1,越接近于1,数据集越适合做因子分析。KMO测度值的大小是判断依据,但不是绝对的,有时KMO值很低也能够得到很好的因子解释。
补充一句:判断数据集是否适合进行因子分析不能盲目地根据一两个参数来定,Bartlett球形检验、KMO测度、相关系数阵、反映象相关阵(负的偏相关系数)等都可以用作判断工具,这些工具的检验结果也并不一定完全一致,灵活应用判断。毕竟,合理的因子解释才是最终判断标准。