缺失值处理的传统方法
列删法 将存在缺失值的被试删除。列删法操作方便,仍目前流行的缺失值处理方法(Peugh & Enders, 2004)。列删法的假设机制是MCAR,在很多情况下很难满足此假设,所以会产生偏差的参数估计(e.g., Enders & Bandalos, 2001)。由于删除了非缺失信息,损失了样本量,进而削弱了统计功效。但是,当样本量很大而缺失值所占样本比例较少时(<5%)可以考虑使用列删法,但任然存在上述不足。
对删法 在计算相关矩阵时,用所有可获得的数据计算,不管是否存在缺失值。同列删法一样,对删法的假设机制也是MCAR,在不满足假设时产生估计偏差(e.g., Enders & Bandalos, 2001)。由于计算每对相关系数基于差异较大的样本,所以存在协方差矩阵非正定的风险(Graham, 2009)。另外,样本的差异也会使计算标准误产生问题(Enders, 2010; Graham, 2009)。
均值替代法(Mean Substitution)使用每个变量的均值去填补该变量的缺失值。这种方法产生估计偏差(Little & Rubin, 1987),最不为方法学者推荐(Allison, 2003; Enders, 2006, 2010; Graham, 2009)。
回归法 (Regression Imputation) 根据变量间的相关,利用其他变量的信息通过建立回归方式去推算缺失值。该法同样会产生估计偏差(Enders, 2006, 2010)。
相似反应类型插补法(Similar Response Pattern Imputation) LISREL处理缺失值的一种方法。通过从有类似反应模式的个体得分中获得一个数值填补缺失值。如果完整数据找不到类似反应则不能完成插补,在MCAR下产生无偏的参数估计,在MAR下产生偏差估计但偏差要不列删法和对删法要小(Enders & Bandalos, 2001)。
平均同质项目法 假设个体在某一因子的某些条目上存在缺失值,通过平均其他几个条目得分来填补缺失值。这种做法在实际中很常见,但缺陷也很明显(Schafer & Graham, 2002)。
获得更多信息可以参见:
http://www.hneap.com/a/EAPanli/kechengxinxi/2012/0516/201.html