全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
37488 14
2011-06-29
一般情况下,我们都认为大样本时的分布接近正态分布,但是我的样本很大(10000人),数据经过清洗,处理了缺失值和极端值,在正态性检验中却检验为正偏态,而不是正态或者接近正态,造成这种现象的可能原因是什么?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2011-6-29 11:28:11
fangjie-fanglu 发表于 2011-6-29 11:02
一般情况下,我们都认为大样本时的分布接近正态分布,但是我的样本很大(10000人),数据经过清洗,处理了缺失值和极端值,在正态性检验中却检验为正偏态,而不是正态或者接近正态,造成这种现象的可能原因是什么?
没有你这个说法的!
正确的说法是这样的(中心极限定理):
样本是从总体中随机抽选出来的,只要样本容量足够大,所有样本的平均值就以总体的平均值为中心呈现正态分布。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-6-29 11:36:11
是随机抽取的吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-6-29 16:56:09
是方便取样
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-6-29 17:06:11
很多统计方法都是以数据的正态分布为前提条件,因此,在使用这些统计方法前,要对数据进行正态性检验,以检验是否符合该统计方法的前提条件。但是,数据的样本量达到10000人,数据的正态性检验却不是正态分布,导致下一步的统计分析难以进行,这让人十分尴尬。请问各位大虾,此时应该怎么办呢?是否不必管正态性检验的结果而直接使用以正态分布为前提的统计检验呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-6-29 18:10:21
哎……不是正态分布那就采用非参数检验啊,一般社会科学的采样受非控制因素影响较大,不符合正态分布是常有的事。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群