数学小白学数学2:理解方差
一、认识方差的基本公式
方差是衡量一组数据离散程度的重要指标,常见的有两种计算方式:总体方差与样本方差。我们先从最基础的“总体方差”开始学习,其标准表达式如下:
总体方差公式:
σ = (1/N) × Σ(xi - μ)
虽然看起来符号复杂,但其实每个部分都有明确的实际意义,我们可以像记单词一样逐个理解:
| 符号 |
含义解释 |
| σ |
总体方差(读作“西格玛平方”) |
| N |
数据总数量(例如奶茶店连续5天的甜度记录,则N=5) |
| xi |
第i个具体数值(如“第3天的甜度值”) |
| μ |
所有数据的平均值(即总体均值,读作“缪”) |
| (xi - μ) |
单个数据与平均值之间的偏差(比如某天甜度比平均高或低多少) |
| (xi - μ) |
将偏差取平方,防止正负值相互抵消 |
| Σ |
求和符号(表示从第一个数据到最后一个数据的所有平方偏差相加) |
[此处为图片1]
二、三步走策略:轻松计算方差
与其死记硬背公式,不如掌握它的逻辑结构。下面我们以“奶茶店B的甜度数据(2, 3, 4, 5, 6)”为例,分三步完成总体方差的计算。
步骤1:计算总体平均值 μ
平均值 = 所有数据之和 ÷ 数据个数
代入数据得:
μ = (2 + 3 + 4 + 5 + 6) / 5 = 20 / 5 = 4
步骤2:计算每个数据的“平方偏差” (xi - μ)
分别计算每一天甜度与平均值4的差的平方:
- 第1天(x=2):(2 - 4) = (-2) = 4
- 第2天(x=3):(3 - 4) = (-1) = 1
- 第3天(x=4):(4 - 4) = 0 = 0
- 第4天(x=5):(5 - 4) = 1 = 1
- 第5天(x=6):(6 - 4) = 2 = 4
步骤3:求“平方偏差”的平均值
先将所有平方偏差相加:
4 + 1 + 0 + 1 + 4 = 10
再除以总数N=5:
10 / 5 = 2
因此,奶茶店B的总体方差 σ = 2,结果准确无误!
[此处为图片1]
三、进阶知识:样本方差的小调整
当所用的数据只是整体中的一部分(即样本),比如从100家奶茶店中抽取5家作为代表时,应使用“样本方差”公式:
样本方差公式:
s = (1/(n-1)) × Σ(xi - x)
与总体方差相比,仅有两个区别:
- 符号变化:总体均值 μ 变为样本均值 x(读作“x拔”),数据总量 N 改为样本量 n;
- 分母不同:由 N 改为 n1,这一修正确保了对总体方差的更优估计,无需深究原理,只需记住“样本用n1”即可。
仍以上述5个甜度数据作为样本进行计算:
此时分母为 51 = 4,其余步骤完全一致。
四、核心要点:公式无需死记硬背,掌握3个步骤即可
不论是计算总体还是样本的方差,其本质逻辑始终遵循以下三个步骤。公式只是这一过程的标准化表达形式:
- 计算数据的平均值(用 μ 表示总体均值,或用 x 表示样本均值);
- 求出每个数据点与平均值之间差值的平方,即“偏差的平方”;
- 将这些“平方偏差”取平均——其中总体方差除以数据总数 N,而样本方差则除以 n1。
从实际应用角度看,通常不需要手动完成全部计算。在 Excel 中,只需输入 “VAR.P(数据范围)” 即可得到总体方差,使用 “VAR.S(数据范围)” 则可获得样本方差。[此处为图片1]
然而,理解背后的公式原理有助于更准确地解读分析结果,把握统计数值的实际含义。