对于正态性检验,尤其是 小样本情况下,有时只能得出近似的结论,完全理论上绝对的正态是不存在的,现举例如下:
(ststa 程序,仅作参考:
. input x
x
1. 1
2. 2
3. 3
4. 4
5. 5
6. 6
7. 7
8. 8
9. 9
10. end
(上以变量是1 2 3...9等共 9个数字,前面的数这系统自动加上的记录号,直观感觉,这9个数字不可能是正态分布的。)
请看程序正态检验的结果——两种方法都是正态,并切检验的P-值均远大于0.05!
. swilk x (笔者注:此即 Shapiro-Wilk 正态检验命令。)
Shapiro-Wilk W test for normal data
Variable | Obs W V z Prob>z
-------------+-------------------------------------------------
x | 9 0.97229 0.407 -1.363 0.91356
. sktest x (笔者注:此即 Skewness/Kurtosis 正态检验命令。)
Skewness/Kurtosis tests for Normality
------- joint ------
Variable | Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi2
-------------+-------------------------------------------------------
x | 1.000 0.364 0.89 0.6394
所以,当样本n很大时(经验上取n>30),可不必太介意正态性问题。也就是说,总体是否严格服从正态分布,并不影响结论的正确性。