在回答这个问题之前,我们先看一下计算标准差的步骤:
1. 计算每个值与样本均值之差的平方。
2. 将这些值相加。
3. 将总和除以 n-1,这称为方差。
4. 取平方根得到标准差。
在第三步,为什么使用的是“n-1”呢?
在第一步中,计算每个值与这些值的均值之间的差。你不知道总体的真实均值,你只知道样本的均值。除了样本均值恰好等于总体均值的少数情况外,数据会更接近样本均值而不是真实总体均值。所以第二步中计算的值可能会比在第一步中使用真实总体均值时的值小一点(并且不能大于),为了弥补这一点,请除以 n-1 而不是 比 n.v —这称为贝塞尔校正(Bessel's correction)。
但是为什么是“n-1”?如果知道样本均值,就可以计算出最后一个值。统计学家说有n-1个自由度。
什么时候应该用 n 为分母计算标准差?
统计学书籍通常会显示两个方程来计算标准差,在分母中:一个使用 n,另一个使用 n-1。有些计算器在计算标准差时也有两个按钮。
n-1 方程用于分析数据样本并希望得出更一般性结论的常见情况。以这种方式计算的标准差(分母为 n-1)是你对总体中标准差值的最佳猜测。
如果你只是想量化一组特定数据中的变化,并且不打算外推得出更广泛的结论,那么你可以使用分母中的 n 来计算标准差。得到的标准差就是这些特定值的标准差。如果你想估计绘制这些点的总体的标准差,以这种方式计算标准差是没有意义的。只有在没有总体抽样的情况下,分母上用n才有意义。
科学的目的总是一般化,所以分母是n的方程不应该使用。
所以,GraphPad Prism 总是用 n-1 作为分母计算标准差。