qiangyoung 发表于 2013-6-15 20:08 
你想让缺失值什么时候为0,什么时候为1?
我的初衷是假如missing data是用multiple imputation来做,得到了年龄层的估算值,如果是<0.5,那么就归为0(小于30岁),如果是>0.5,那么就归为1(大于30岁)。
但是现在我的missing data比例比较小,而且做MI的话电脑跑不起来了,所以我想只用平均值代替。这样的话由于平均值不是一个二分类(0或1)的,譬如说是0.1234,那么就没有意义了;但是由于0.1234<0.5,那么就是全部的missing data都归为0(小于30岁)了,好像也不太好吧,而且还不如直接全部把missing data替换成0就更简单了吧。。
呵呵 谢谢热心帮助!!