ermutuxia 发表于 2014-11-7 16:01 
如果某一个变量的缺失值特别多建议回归方程中就不要加入这个变量了,因为回归的时候用的是所有变量都不缺失 ...
啊谢谢您~我后来问了老师,老师的意思跟您是一样的。
不过我的考虑是这样:我想分离出来两个群体A和B,然后就人群特征做一分析,以及这两人群的收入差异做以一分析。考虑到人群特征,我就不敢对数据进行大处理,特别是删掉很多缺失。不过后来我选择了其他年份后发现缺失没有特别严重。但有一项是受教育程度,大概有20个的缺失,样本总量是300+。我看了版上的一些贴,说是可以用SPSS做一个缺省值分析,判断他到底是随机丢失还是其他,然后根据情况再对缺失值进行处理。我在这里采取了这种方式~不知道有没有问题?