全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
6723 5
2014-10-08

想要检测数据是否符合正态分布,进行探索分析,可是出现了很多缺失案例,这样检测结果还可靠吗?该怎么处理?为什么会出现缺失案例呢?求大神指导!

案例处理摘要
案例
有效缺失合计
N百分比N百分比N百分比
2011年单位面积用电量4559.160975.9655341.0
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-10-8 11:42:04
如果是看是否符合正态分布,就把有效数据进行探索性分析,看各项值的情况吧。缺失值出现的原因是多种多样的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-10-8 12:09:39
缺失值成列出现的话,可以做删除列与其他列的相关性分析,大于0.7就可以考虑成列删除。
成对出现的话,同上,只不过,可以看看删除前后影响大小,再定夺。
如果很多数据不能删的话只能做拟合回归,做回归线,自行在缺失处做插补。EM算法可以在缺失下取得ML估计量的一个普遍办法。
最大似然估计:选取那些若取值真实,就可以最大化观察到事实上被观察到的概率的值
这些是常见的,其实还是要根据数据类型具体分析,个人观点,希望能帮到你。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-10-8 13:19:43
seven兮 发表于 2014-10-8 12:09
缺失值成列出现的话,可以做删除列与其他列的相关性分析,大于0.7就可以考虑成列删除。
成对出现的话,同上 ...
学到啦~非常感谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-10-8 13:21:00
mapleleaf_0313 发表于 2014-10-8 11:42
如果是看是否符合正态分布,就把有效数据进行探索性分析,看各项值的情况吧。缺失值出现的原因是多种多样的 ...
我又分析了下,基本把问题解决啦~谢谢!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-10-8 16:49:49
相当好啊                                                                        
                                       
                                                     
                                                     
                                             
                                                                 
                                                                                 
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群