全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 悬赏大厅 求助成功区
1343 3
2013-09-22
悬赏 50 个论坛币 已解决
请问,数据统计数据时,有的变量的数据缺失,那么数据到底缺失到什么程度,这个变量就不能计入数据实证了呢?
比如说:一个变量有30个样本数据,如果这个变量的样本数据缺失多少个,那么这个变量就不能实证了呢?5个?10个?12个?15个?

最佳答案

ehelloe 查看完整内容

30个样本本身就少,如有缺失如何保证分析结果的可靠性? 30个样本,缺失5个,就是1/6的缺失率。根本就不必做了!做了也没有什么意义
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-9-22 20:15:30
30个样本本身就少,如有缺失如何保证分析结果的可靠性?
30个样本,缺失5个,就是1/6的缺失率。根本就不必做了!做了也没有什么意义
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-9-22 20:54:24
如果是300个样本,缺失30个,还勉强可接受。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-9-22 22:08:50
这位朋友,谢谢啊!
我答复你的问题,本不为金币而来——我答的时候,也没有看清这是个悬赏帖子。也只是简单回答了下。

有关数据缺失值的问题,还会有更完整科学的答案。你自己也可以查一下有关统计学著作。
我这里先加一个:如果你是做有关宏观数据的统计分析,记得我的计量经济老师讲过,也就几十年的数据,尽量不要缺失。不行,就要将包含缺失值的样本删除(也就是年份数据),那就需要缩小研究时期。如想要做从1949-2012年的研究,一般都会将文革时期排除在外,那就最好从改革开放之后研究。

此外,如果样本中仅有个别变量出现缺失,只要这个变量不是重要变量(如重要的自变量与因变量),就可以将此变量删除。当然,最好不影响你的理论假设。还有性别变量如出现缺失,基本上采取的是删除方法。因为缺失值用均值来替代也没有意义,也会扭曲统计上的解释。
希望能帮到你。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群