峰度系数用来度量数据在中心聚集程度。在正态分布情况下,峰度系数值是0。正的峰度系数说明观察量更集中,有比正态分布更长的尾部;负的峰度系数说明观测量不那么集中,有比正态分布更短的尾部,类似于矩形的均匀分布。峰度系数的标准误用来判断分布的正态性。峰度系数与其标准误的比值用来检验正态性。如果该比值绝对值大于2,将拒绝正态性。
偏度系数用来度量分布是否对称。正态分布左右是对称的,偏度系数为0。较大的正值表明该分布具有右侧较长尾部。较大的负值表明有左侧较长尾部。偏度系数与其标准误的比值同样可以用来检验正态性。如果其比值绝对值大于2,可以认为拒绝了正态性。
百分位数是资料分布数列的百等份值,用于描述样本或总体观测值序列某百分位置的水平。四分位数(quartile)是特定的百分位数。
四分位数中,P25为下四分位数Ql,P75为上四分位数Qu。四分位数间距即Qu-Ql。四分位数间距比极差稳定,但仍未考虑每个数据的变异程度。
方差与标准差能反映整个资料的变异程度。标准差用于描述变量值的离散程度,可以反映数据分布情况,计算参考值范围。