上一期,我们讲了牛掰家族伯努利提出的伯努利实验和伯努利分布(略微涉及了二项分布的部分内容),今天我们就详细的看看伯努利分布的老子,二项分布的一些概念和性质。
本期内容分为四部分
- 二项分布概述
- 二项分布的性质(期望,方差)
- 性质证明
- 二项分布与其他分布的关系
首先我们来聊聊什么是二项分布
上文我把二项分布成为伯努利分布的老子,其实是因为伯努利分布是一个特殊的二项分布(就像他的一个儿子~~),如果有一个伯努利实验,我们在相同的条件下重复做N次,并且每次实验结果互相独立,那么这就是N重伯努利实验,如果X是个随机变量,用它作为伯努利实验成功的次数,那么X就是二项随机变量,如果再用一个函数来刻画X取不同值时的概率值,那么这个函数就被称为二项分布。
统计学上的定义是这样的:在概率论和统计学中,二项分布是n个独立的是/非试验中成功的次数的离散概率分布,其中每次试验的成功概率为p。这样的单次成功/失败试验又称为伯努利试验。实际上,当n = 1时,二项分布就是伯努利分布。二项分布是显著性差异的二项试验的基础。
什么时候可以用二项分布?
医学领域有许多二分类记数资料都符合二项分布(传染病和遗传病除外),但应用时仍应注意考察是否满足以下应用条件:
(1) 每次实验只有两类对立的结果;
(2) n次事件相互独立;
(3) 每次实验某类结果的发生的概率是一个常数。
二项分布的期望和方差是多少?
如果X~B(n,p)
,E(x)=np;Var(x)=np(1-p)
如何证明?
二项分布的数学期望
X~b(n,p),其中n≥1,0<p<1.
P{X=k}=C(n,k)*p^k*(1-p)^(n-k),k=0,1,...,n.
EX=np,VarX=np(1-p).
证明方法(一):
将X分解成n个相互独立的,都服从以p为参数的(0-1)分布的随机变量之和:
X=X1+X2+...+Xn,Xi~b(1,p),i=1,2,...,n.
P{Xi=0}=1-p,P(Xi=1)=p.
EXi=0*(1-p)+1*p=p,
E(Xi^2)=0^2*(1-p)+1^2*p=p,
VarXi=E(Xi^2)-(EXi)^2=p-p^2=p(1-p).
EX=EX1+EX2+...+EXn=np,
VarX=VarX1+VarX2+...+VarXn=np(1-p).
证明方法(二):
EX=∑kb(k;n,p)=∑k*C(k,n)p^kq^(n-k)
=np∑C(k-1,n-1)p^(k-1)q^(n-1-k+1)
=np∑C(k,n-1)p^kq^(n-1-k)
=np∑b(k;n-1,p)
=np
VarX=npq 可用公式VarX=EX^2-(EX)^2求出
EX^2=∑k^2b(k;n,p)
=∑[k(k-1)+k]b(k;n,p)
=∑k(k-1)b(k;n,p)+∑kb(k;n,p)
=n(n-1)p^2∑b(k;n-2,p)+np
=n(n-1)p^2+np=n^2p^2+npq
=n^2p^2+npq
所以VarX=EX^2-(EX)^2=n^2p^2+npq-n^2p^2
=npq
其实二项分布除了和伯努利有“血缘”关系,还和很多分布都有牵连(情感线很丰富啊~~),比如下面已经被我们找到的这些:
- 泊松二项分布:二项分布是泊松二项分布的一个特殊情况。泊松二项分布是n次独立、不相同的伯努利试验(pi)的和。如果X服从泊松二项分布,且p1 = … = pn =p,那么X ~ B(n, p)。
- 正态分布:如果n足够大,那么分布的偏度就比较小。在这种情况下,如果使用适当的连续性校正,那么B(n, p)的一个很好的近似是正态分布N(np,np(1-p)),n越大(至少30),近似越好,当p不接近0或1时更好。不同的经验法则可以用来决定n是否足够大,以及p是否距离0或1足够远:一个规则是x=np和n(1 − p)都必须大于 5。
- 泊松近似:当试验的次数趋于无穷大,而乘积np固定时,二项分布收敛于泊松分布。因此参数为λ = np的泊松分布可以作为二项分布B(n, p)的近似,如果n足够大,而p足够小。
- 多项分布:当实验结果不是两种对立,而是多种对立,比如扔硬币和掷骰子,就是二项分布和多项分布了。
最后来个小技巧:如何使用excel计算二项分布
二项分布=BINOMDIST(x(d),n,p,false),括号里分别为成功次数,试验次数,成功概率,累计分布。
成功次数:指在试验中成功的次数;
试验次数:指独立试验的次数;
成功概率:指每次试验成功的概率;
累计分布:若0,得到的是概率值;若1,得到的是累计概率。
帮助人大经济论坛推广,复制贴子内容(带人大经济论坛网址)并发到其他论坛和网站;或点击贴子标题后的“推广有奖”,把本贴推荐到QQ群或自己的微博(最好@人大经济论坛),然后跟贴贴出链接或截图,证明已作推广的,将获得如下论坛币的奖励!(大家一定要把群现有人数或微博粉丝人数截屏出来哦~不然只能奖励10个币哦)
活动奖励方式(同一个群或微博或网站分享多次算一次,所有截图均需显示分享人数,否则默认低档奖励):
1.凡分享的QQ群,人数在100人以下的,视情况奖励10-20论坛币;100-500人的,奖励20-50论坛币(每群限奖励一次);500人以上的奖励50-100论坛币。
2.凡分享到微博,您的粉丝在100人以下的,视情况奖励10-20论坛币;100-500人的,奖励20-50论坛币(每微博限奖励一次);500人以上的奖励50-100论坛币。
3.凡分享到其他网站(包括校内网等),帖子保留一天以上的(24小时后截图),奖励50论坛币