全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1956 8
2015-10-08

用rnorm(100,0,1)随机生成一百个正态分布的数字。

用shapiro.test()检验得到p-value=0.02012<0.05,即不是来自正态分布的样本,这是怎么回事呀
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-10-8 17:03:03
你用shapiro.test去检验1~10这10个数,你会发现更加惊奇的结论。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-10-8 19:43:30
古典统计学的正确性在于 样本数趋于无穷:一切以渐近性为核心. 本来在大样本下方能正确应用,但现在变成了"小样本"统计工具"!!
楼主用一个样本验正shapiro.test 不符它的前提假设:渐近条件下才正确
本人用100000个样本验正,它是基本正确的:见下:
xm<-matrix(rnorm(1000*100000),nrow=1000)  ###获得100000个有1000个观察的样本
yshapiro<-apply(xm,2,function(x) shapiro.test(x)$p.value) ###计算十万个样本的shapiro.test的p 值
sum(yshapiro<0.05)/100000   ###计算十万个样本的p 值中p<0.05的占比
[1] 0.05139     ###结果接近理论值 0.05  ,毕竟十万还不是理论要求的”无穷“!!!!!!!!!!


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-10-8 19:48:40
因此,验正古典统计方法的正确性,要有接近无穷的样本,否则任何结果的出现都是不奇怪的!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-10-8 19:53:06
为了直观,传上yshapiro(p值)计算值的密度图!~!!
附件列表

Rplots.pdf

大小:7.24 KB

 马上下载

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-10-9 00:24:37
jgchen1966 发表于 2015-10-8 19:53
为了直观,传上yshapiro(p值)计算值的密度图!~!!
什么叫用数据说话?这就叫用数据说话!
什么叫深入浅出?这就叫深入浅出!
牛人!赞一个!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群