多数人都喜欢参数检验,我觉得这更多的是一种心理上的原因,当我们碰到一件新事物的时候,总希望能对他们稍微有些了解。丝毫不了解的事物我们会恐惧、茫然无措。比如鬼魂,我们不知道他是什么样子,无从描述。非参数检验也是一样,我们对数据丝毫不了解,不知道他是园的还是方的,所以很困惑,总觉得无从下手去分析。
我最近看一些统计学家的传史,发现一个有意思的现象:原来当初发明Wilcoxon秩和检验的Wilcoxon并不是个统计学家,而是个化学家,他在化学研究中发现总有一些极值影响分析结果,但这些极值是客观存在的,又不能轻易删掉,所以他就想办法来处理,结果一不小心成了统计学家。原创了Wilcoxon秩和检验方法。后来Mann和Whitney又合创了Mann-Whitney方法,结果发现与Wilcoxon结果差不多。
非参数检验时,我对数据什么都不用了解,就是直接看数据本身,将数据的散点图与纯随机分布的情形比较,就知道结果了。很多人对非参数检验存有歧视,总觉得他好像只是一个杂志的增刊,不够正式。
早在上世纪40年代的时候,皮特曼就发表了一篇文章,建立起有关参数与非参数方法的关系逻辑。他非常惊讶的发现,即使数据符合正态分布,非参数检验的结果也几乎和参数检验一样的完美。而一旦数据稍微偏离参数模型,非参数检验的结果将远远优于参数检验。
这一结果令人吃惊,是吗?但这不是巧合。很多东西都不会像我们想象的那样令人一目了然。一般人的眼里,似乎参数就是好的,非参数是不好的,但实际情形却并非如此。很多我们想当然的结果并不一定是真相,有可能只是我们的想象而已,就像当年亚里士多德所说的“总的物体理所当然比轻的下落的更快”。所以我们对任何事情,一定要有自己的主见,而不要凭想当然来判断。
当年的Wilcoxon并不是学统计学的,皮特曼也是后来该行学统计学的,我说这个是为什么呢?当初他们在一无所知的情况下也能成为今天统计学教材上的人物,为什么我们有更多资源利用却无法学会统计学呢?我相信更多的是个人因素,而不是客观因素。难道我们的条件比20世纪的Wilcoxon和皮特曼更糟糕?
同时,也问问各位小伙伴对非参数统计是怎么看的?这段时间有个词叫做“小数据”,大家又对小数据怎么看呢?
帮助人大经济论坛推广,复制贴子内容(带人大经济论坛网址)并发到其他论坛和网站;或点击贴子标题后的“推广有奖”,把本贴推荐到QQ群或自己的微博(最好@人大经济论坛),然后跟贴贴出链接或截图,证明已作推广的,将获得如下论坛币的奖励!(大家一定要把群现有人数或微博粉丝人数截屏出来哦~不然只能奖励10个币哦)
活动奖励方式(同一个群或微博或网站分享多次算一次,所有截图均需显示分享人数,否则默认低档奖励):
1.凡分享的QQ群,人数在100人以下的,视情况奖励10-20论坛币;100-500人的,奖励20-50论坛币(每群限奖励一次);500人以上的奖励50-100论坛币。
2.凡分享到微博,您的粉丝在100人以下的,视情况奖励10-20论坛币;100-500人的,奖励20-50论坛币(每微博限奖励一次);500人以上的奖励50-100论坛币。
3.凡分享到其他网站(包括校内网等),帖子保留一天以上的(24小时后截图),奖励50论坛币