这位朋友,谢谢啊!
我答复你的问题,本不为金币而来——我答的时候,也没有看清这是个悬赏帖子。也只是简单回答了下。
有关数据缺失值的问题,还会有更完整科学的答案。你自己也可以查一下有关统计学著作。
我这里先加一个:如果你是做有关宏观数据的统计分析,记得我的计量经济老师讲过,也就几十年的数据,尽量不要缺失。不行,就要将包含缺失值的样本删除(也就是年份数据),那就需要缩小研究时期。如想要做从1949-2012年的研究,一般都会将文革时期排除在外,那就最好从改革开放之后研究。
此外,如果样本中仅有个别变量出现缺失,只要这个变量不是重要变量(如重要的自变量与因变量),就可以将此变量删除。当然,最好不影响你的理论假设。还有性别变量如出现缺失,基本上采取的是删除方法。因为缺失值用均值来替代也没有意义,也会扭曲统计上的解释。
希望能帮到你。