darkworld 发表于 2012-12-5 15:31 
懂了,合理造数据,嘿嘿。
希望你的老板看到的是“合理”而不是“造”这个字。
今天上了课,缺失数据的处理,是很重要的一块内容。缺失情况分为三种:
完全随机缺失,
随机缺失,
和飞随机缺失。
根据不同的情况选择不同的方法。
我用的是naive的方法,还有很多其他方法,相对准确一些。但对于缺失比较大的时候,填充缺失数据数据的可信度就不高,关于缺失数据达到多少填充不准确也没有定论。对于缺失数据的处理,sas中 proc ML可以做。
还在研究,相信有更好的填充方法,统计还是十分有用。