第一节 区间估计
一、概念
定义:设统计量θ1(x1,……,xn)< θ2(x1,……,xn), 则称[θ1,θ2]是随机区间,
定义二:设θ是总体X的未知参数,若存在[θ1,θ2],使得对给定的α(0<α<1)满足P(θ1≤θ≤θ2)=1-α,则称[θ1,θ2]是θ的100(1-α)%置信区间,1-α称为置信度,θ1是置信下限,θ2是置信上限。
例:某旅行社为调查当地每一位旅游者的平均消费水平,随机采访100名旅游者,平均消费为 =80元,已知消费额X~ N(μ,122),试问消费者平均消费额μ的置信度为95%的置信区间是什么?
分析: 是μ的较好点估计;P{| -μ|<λ}=1-α,已知1-α=0.95, =80,要求μ的区间,关键是λ。这就需要找出 -μ的统计量,并且知道其分布。
方法: , , ,
解不等式,已知α,查表得到 , < , - < < ,
得到: , ,得到置信下限和置信上限。
所以μ的(1-α)100%置信区间是[ , ]。本例中 =80,σ=12,n=100, ,带入得到置信区间是[77.6, 82.4]。
解释: 是区间的中心,d= 是区间的半径,L=2d是区间长度。
说明:置信度1-α的定义:有样本值[θ1,θ2]能包含真值θ的概率为1-α。置信区间的大小刻画了参数θ的精确程度半径d表示用 估计μ的误差范围。d大好还是小好?由d的公式,d与n, α有关,1-α一定,n越大,d越小,精确度好;n一定,例如1-α=0.99,
找参数θ的一般方法:θ的较好点估计 ;给定1-α,选取有关θ和 的统计量,并且知道其分布,P(| -θ|<λ)=1-α,可以查表得到λ。解不等式| -θ|<λ,得到θ的置信度为(1-α)100%置信区间[θ1,θ2]。
二、数学期望的区间估计
设总体X~ N(μ,σ2), ,已知方差σ2,μ的(1-α)100%置信区间是[ ]。
如果未知方差。因为 , , 解不等式 , ,
所以μ的(1-α)100%置信区间是:
三、方差的置位区间
σ2的较好点估计s2。总体X~ N(μ,σ2)
1. 若μ的估计值未知,σ2的置信度为100(1-α)%的置信区间是: ,其中左边=
, ,
得到:
2. 若μ已知,Xi~ N(μ,σ2),(Xi-μ)/σ2 ~ N(0,1),所以 ,
,解不等式,得到:
四、两个总体均值差、方差比的置位区间
X~ N(μ1,σ12), (X1,……,Xn1)是X的样本,s12是样本方差。
Y~ N(μ2,σ22), (Y1,……,Yn2)是Y的样本,s22是样本方差。X,Y独立。
1. 已知σ12,σ22,μ1-μ2的100(1-α)%置信区间是:
, , ,
得到: ,
,
所以μ1-μ2的100(1-α)%置信区间是( )
用处:[θ1,θ2],θ2<0说明μ1-μ2<0, μ1<μ2, 相信μ1<μ2的概率是1-α;θ1>0,μ1-μ2>0, μ1>μ2; 包含0,无法判断μ1,μ2的大小。
2. 未知方差,但是方差 ,有齐次性,μ1-μ2的100(1-α)%置信区间
, ,
,所以100(1-α)%置信区间是:
[ ]。
3. 方差比 的100(1-α)%置信区间
, , 。
五、0——1分布参数的区间估计
设n>30,大样本;(x1,……,xn)是样本,
样本X:
X 0 1
P q p
p>0, p+q=1, EX=p
xi都是(0-1)分布。
p的较好点估计 ,选有关统计量:
( ),得到:
所以 , ,
由于 ,两边都有 ,不好求。所以改变方法,两边同时平方:
, , ,解之得到区间(p1,p2)。