用rnorm生成的随机数为什么没过w检验？

羊乖乖

2151

收藏 2015-10-08

用rnorm（100,0,1）随机生成一百个正态分布的数字。

用shapiro.test()检验得到p-value=0.02012＜0.05，即不是来自正态分布的样本，这是怎么回事呀

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

statslife

2015-10-8 17:03:03

你用shapiro.test去检验1~10这10个数，你会发现更加惊奇的结论。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

jgchen1966

2015-10-8 19:43:30

古典统计学的正确性在于样本数趋于无穷：一切以渐近性为核心. 本来在大样本下方能正确应用,但现在变成了"小样本"统计工具"!!
楼主用一个样本验正shapiro.test 不符它的前提假设：渐近条件下才正确
本人用100000个样本验正，它是基本正确的：见下：
xm<-matrix(rnorm(1000*100000),nrow=1000) ###获得100000个有1000个观察的样本
yshapiro<-apply(xm,2,function(x) shapiro.test(x)$p.value) ###计算十万个样本的shapiro.test的p 值
sum(yshapiro<0.05)/100000 ###计算十万个样本的p 值中p<0.05的占比
[1] 0.05139 ###结果接近理论值 0.05 ,毕竟十万还不是理论要求的”无穷“！！！！！！！！！！