全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管百科 爱问频道
10440 20
2014-08-12
梗概

本文初衷在理清中心极限定理,第一部分探讨了正态分布现象背后隐藏的人
们对一致、一样的哲学态度。第二部分严格地论证了标准正态分布从构造到
形成函数表达式的过程。整片文章是个探索的过程,凝聚了比较多的思考,
最后也得到令自己比较满意的结果。历时两周,欢迎感兴趣的同学指正。
---------------------------------------------------------------------------------------------------------------------------------------------------------

正态分布真的普遍吗?

1935年中心极限定理被证明。我们需要重新梳理下,我们想证明的问题是什么。就是为什么现实生活中会有那么多的正态分
布,有吗?你是否有观察到这样的现象?其实这些东西对我来说是说法,因为大家都这么说的。一个对称的,均值的密度函
数最大的分布。如果它是那么寻常的存在,我们可以从身边找到这样一个例子吗?那干脆这样好了,就在现在这样一个时刻
我去版上发帖列表里面,每一页抽取排在第一行的发帖的人,我们观察他发一共发了几个帖子,就在这会儿,他们还不知道
我的计划,他们不会要有意影响我的结果。我抽取了20个,样本量太小了,即便按照区间做依然看不出规律。

310 1  1257  25  6516  12  518  487 487 18  5  97  10  219  201 5 2398  15  321  482

不知道高斯当年研究了多少测量的误差才发现的规律,怎么构造出来的函数。如果我就要针对我设定的这种场合抽样,为了
显得均匀我应当抽986个,要做到这个靠人效率太低了,如果知道网页的结构,这样的去去抽样应该是会很容易的。是啊,这
里的问题其实就变成了,如何得到想要的网页位置上的字符这样的问题,其实会很有意思啊,但是我自己不会做。我觉得就可以按照我自己这个思路做一下。在互联网的世界里信息太丰富了,自己取来的数据会最放心咯。其实就是获取第一手的数据。

如果想得到第一手的关于事实的信息,需要一点技术,但是也不会难。

为什么正态分布这么普遍的存在?

正态分布是高斯在研究非系统性误差是发现构造出来,当有很多因素都会影响到一个随机变量,而且影响都不大时,就会
呈现出正态分布的形态。这种类标准化的情形是广泛存在的,对于人类的标准生产领域是很容易理解的,我们力争生产出
其他商品能够顺利“接口”被广泛使用的“标准”产品。人类的努力就在减少各种系统性的误差。对于自然的现象其实也能找
到合理的解释方法,就以人各个方面的特性为例,身高,体重,这些,本质的原因在基因,人类的基因是一套的,信息也
是可以融合,基因的特性就在于以信息的方式“植入”动物,植物个体,让他们携带着它们长存。个体所带信息是可以互换
重组的,必然要求“标准化”方便碱基对配对,人类也算大自然的一种产品,他们会自发的完成基因交予的种种使命,长大
互惠、敌对、生育。人类排斥异类,接近平均值被认为是美。生物共用基因组,同种具有一样的染色体条数,就能解释
人的性状的标准性。这启示我们正态分布的背后必然存在某种很确定的一致性。当然,我们也可以通过验证我们认为应该
是正态的事物来确定背后的某种一致性是否已经遭到破坏。为什么正态分布这么普遍,因为世界上存在很多在某个范畴下
是“一样”的事物。NB。这还启示我们,要探索正态分布背后“一样”的东西,要上升一个范畴层次。这竟然是可以量化的!!!
而且还是在研究非系统性误差时发现的,有点不可思议,如果一些东西它们没有系统性的差异,那么它们有的就是各个层
面上的一致性,这是再自然不过的,如果非系统性的差异是正态的,那么在加上大家一致性的那一部分得到的那个量也就
是正态的,所以正态分布的存在就是那么的广。

系统性差异和系统一致性以及一致性下差异

我们想做的事情就是将这么普遍存在是的事物用数学描述,这个过程必须严格。其实大家都会有感受就是数学的两重特性
General和严格,她让这两种貌似相悖的东西并行不悖。所以一开始我们越不限定条件越好。我们先看自己如何理解系统性
误差,其实就是能够统一影响我们关注的一类事物的信息的改变,对是改变、差异这样的描述更准确,比如,确真存在的
例子:生物体的变异,如果一些具有26条染色体的生物变成成52条并且作为物种生存了下来,这就是一种系统性的改变,
基因信息的改变直接导致生物各种性状质的改变,这种质的改变,就是基因信息再无法与改变之前的个体进行交流。从一
个例子,我们能抽取到描述系统性误差关键的因素,信息不可交流。这里你可能会说这个例子显得有点特殊,其实不然,
我们再以人类的标准化生产为例,同一品牌下同一型号产品,它们里面的元件是可以互换的,这时候你也许会说同一个元
件是可以装在不同型号的手机里面的,但是,你也一定认同,两种型号的手机对于它们各自所使用的元件的集合而言,两
个集合一定是不一样,也就是不是所有的元件是可互换的。这样我们更加清晰了系统性差异的特性——所有的构成信息不
可互换
。同时我们将高斯研究误差时候的“误差”概念更一般的推广到“差异”。也正是因为这种信息的不可互换,我们能显
著的观察到系统性差异。相对的,我们可以这样描述系统一致性,就是所有的构成信息在两个体之间可互换,可互换意味
着不容易观察到,也是为什么比较远的人难以分辨双胞胎,为什么两个同款的手机比较难分辨。因此,我们的研究对象是
没有系统性差异而具有系统一致性下差异的事物
。当然问题的精细程度是由目的决定的,为不同身高人群的人定制衣服和
为需要器官移植的人进行配型,这两个问题的一致性关注点不一样,可互换的信息精度要求也不样,可以穿同一款衣服的
两个人不一定能通过器官移植配型,可以给A进行器官捐献的B也不一定能和A穿同一款衣服。但是我们此处的概念却对两
种一致性都是适用的。NB。
------------------------------------------------------------------------------------------------------------------------------------------------------
直观地理解中心极限定理

首先我们必须承认一个事实:最严格的意义下,世上没有两件完全一样的东西。那一样、一致是什么意思?一致、一样必
然存在于某个“一致性空间”中。有了“东西都是不一样”的这个假设,接下去的工作变得容易。对于上面例子里面的两个一致
性空间度量的变量都是有限个的,不管是定义一款衣服,还是定义可以给A提供器官的若干人体数值,它们都是可操作的,
也就是说它们的一致性空间的一致性标度必然是有限的,我们定义n个独立的一致性标度,\[\xi_1,\xi_2,...,\xi_n.\]
一致性空间中的标度反应出影响这个空间的若干因素,每个因素在这个一致性空间中都接近一个特定的值,具体的观测
值在一个值附近扰动。划分一致性空间的依据就在规定若干对外有显著比较意义的标度值。标度对自己所在特定的一致性空
间职能不在度量显著性差异,因为没有,它的职能就只能是度量那部分扰动量,而如何度量那部分扰动量正是本文探索的焦
点。有点像文化大革命和在广义第二高价的一篇文章里类似描述地专有市场。下图示意一致性空间:

注:由9个随机变量定义的一致性空间,每个随机变量值都在该一致性空间某标度上一特定值附近扰动。

PS:一致性空间的概念完全可以使用在商业环境下,定义商品,定义用户,以及其他具体问题。NB。从一堆不知关系的东
西里面定义出一致性会十分有价值。
PS:关于度量系统,当我们用数值描述性状时,比如颜色,必须要求对于性状的编码符合数系公理。否则数值对于描述
你的性状没有意义,你之后的工作会没有意义。举个反例,两种明显不一样的颜色不能用同一个编码值。
PS:如果我们定义的n个标度不是独立的怎么办?
PS:  对于独立的两个度量系统,比如颜色一个维度,音调一个维度,把这两个维度当做复数的实部和虚部,假设有两个点,
也就是一个颜色配了一个音调,有两个这样的东西。它们之间的距离会是什么意思?当然每一个维度越接近,整体就也接
近。相加减比较好理解,如果是将它们相乘,得到的也是一个新的点,就不大好理解了。其实我想说的就是两种不同意义
的度量系统,它们的融合代表什么呢?sqrt(a^2+b^2)代表三角形的斜边。

那么听话的没性格的一堆标度肯定是受到强权的镇压才成为这个一致性空间的标度的。这个强权就是,让你任何一个标度
测出的差异大于能和所有标度测出差异相匹敌的概率为0!这样标度的性格就无误地被抹杀掉了。同时强权还要求你不能大
多数还很没趣的都变成0。其中有一个标度抱了一丝侥幸,他在乞求“还让我本性存在,只要标度的数量无限多,我的作用不
是就被抹杀掉了吗?”那个强权就是林德贝格条件,那个乞求的声音就是费勒条件。这一堆没性格的标度个性加和占整体绝
对差异的比重就服从标准正态分布。同时我们可以证明那个乞求的声音加上标准正态分布和那个强权的要求是一致的。这就
是中心极限定理,林德贝格-费勒定理。

正态分布被发现是出于对严谨的追求,比如,我们测量一件东西,它明明只是一件东西,我们希望测得一个准确的数值,
我们相信,对于“一个”东西,存在描述它的特定值,可是我们发现,一些误差无法避免,对于一件东西每次的测出值并不一
样,虽然细微,但是存在、捣乱我们,于是,我们就深究之描述之。
--------------------------------------------------------------------------------------------------------------------------------------------------------
一个数学主题:利用中心极限让一致性下差异服从标准正态分布

(1)选定期望、方差

前面我们已经定义好n个独立的一致性标度即随机变量,\[\xi_1,\xi_2,...,\xi_n.\]
计算出它们各自期望、方差以及方差之和,\[a_k=E\xi_k,b_k^2=D\xi_k   (k=1,2,...,n.),B_n^2=\sum_{k=1}^n b_k^2\]
接下去我们为一致性下差异的分布选定数字特征,用n个独立的随机变量构造一个期望为0,方差为1的随机变量,\[\xi_{nk}=\frac{\xi_k-a_k}{Bn},E\xi_{nk}=0,D\xi_{nk}=\frac{D\xi_k}{B_n^2}\]
\[\zeta_n=\sum_{k=1}^n \frac{\xi_k-a_k}{B_n},E\zeta_{n}=0,D\zeta_{n}=\frac{\sum_{k=1}^n D\xi_k}{B_n^2}=1\]
\zeta_n满足了我们对一致性差异的随机变量两个数字特征的要求。

PS:构造符合某些假设的随机变量,满足假设条件的分布会唯一吗?No,看构造假设是什么,目的是什么。

(2)规定其取值范围、连续性


关注可数个一致性差异的随机变量,\[\zeta_1,\zeta_2,\zeta_3,...\zeta_n,...\]
对随机变量\zeta_n在n无穷大的极限情况讨论\zeta_n的分布函数F_n(x),\xi_k的分布函数F_k(x),\xi_nk的分布函数F_nk(x),
\[\lim_{n \to \infty}F_n(x)=\lim_{n \to \infty}P\{\zeta_n < x\}=\lim_{n \to \infty}P\{\sum_{k=1}^n \frac{\xi_k-a_k}{B_n} < x\}\]
\[\lim_{k \to \infty}F_k(x)=\lim_{k \to \infty}P\{\xi_k < x\}\]
\[\begin{alignat}{1}\lim_{n \to \infty}F_{nk}(x)=&\lim_{n \to \infty}P\{\xi_{nk} < x\}=\lim_{n \to \infty}P\{\frac{\xi_k-a_k}{Bn} < x\}=\lim_{n \to \infty}P\{\xi_k <B_n x+a_k\}\\=&\lim_{k \to \infty}F_k(B_n x+a_k)\\ \end{alignat}\]
注:此处,依据\xi_k的定义,n趋于无穷大,k自然跟随趋于无穷大。
通过观察得到两点:
随机变量\zeta_n的取值由\xi_nk的取值决定,随机变量\xi_nk的取值由\xi_k的取值决定;
随机变量\xi_nk的分布函数F_nk(x)能用\xi_k的分布函数表示;

让一致性下差异随机变量\zeta_n成为连续性随机变量,它将有界、有密度函数、有特征函数、有绝对连续的分布函数。
也就会有\xi_{nk}、\xi_k是连续性随机变量,否则反正法会推翻\zeta_n是连续性随机变量的假设。

我们已经给\zata_n随机变量的期望和方差赋好值,0,1,我们要探索\zeta_n分布函数的连续表示,结果只有两种,(1)在现有
知识范围内找得到(2)存在,但是找不到。即便假设错也没关系,反正法会用矛盾告诉我们假设的荒谬。

如此,安心使用假设。

(3)用分布函数表示数字特征
\[E\xi_k=\int_{-\infty}^{+\infty}\,dF_k(x)=a_k,D\xi_k=\int_{-\infty}^{+\infty}(x-a_k)^2\,dF_k(x)={b_k}^2\]
\[\begin{alignat}{1}E\xi_{nk}=\int_{-\infty}^{+\infty}\,dF_{nk}(x)=0,D\xi_{nk}&=\int_{-\infty}^{+\infty}(x-0)^2\,dF_{nk}(x)\\&=\int_{-\infty}^{+\infty}x^2\,dF_k(B_n x+a_k)\\&=\int_{-\infty}^{+\infty}(\frac{y-a_k}{B_n})^2\,dF_k(y)\\ \end{alignat}\]
\[\begin{alignat}{1}E\zeta_n=\int_{-\infty}^{+\infty}\,dF_n(x)=0,D\zeta_n&=\int_{-\infty}^{+\infty}(x-0)^2\,dF_n(x)=1\\&=\int_{-\infty}^{+\infty}x^2\,dF_n(x)\\ \end{alignat}\]

观察到一点和一个问题:
F_{nk}(x)和F_k(x),前者的随机变量只由一个后者的随机变量决定,前者的分布函数能用后者的直接表示出来。

\zeta_n随机变量小于x这个事件如何用描述\xi_{nk}、\xi_k的某一种函数表示?
分析:\xi_k的取值可以很任意,\xi_{nk}的取值表示k标度上的扰动占整体扰动扰动的比例,\zeta_n表示有n个标度时
\xi_{nk}的和。这里有一点违反我们的直觉,为什么\zeta_n不是确定值1?如果我们关注n=2的情况,用a、b表示某次扰
动,即a=\xi_1-a_2,b=\xi_1-a_2,此时,\zeta_2>1,即此时刻\zeta_n所在的一致性空间的一致性差异是个大于1的数字,
大于它的期望。前面已经允许它在实数上连续取值了。
\[\frac{a+b}{\sqrt{a^2+b^2}}>1,a>0,b>0\]
扰动有正有负,所以\zeta_n有正有负。假如\xi_k扰动1万次,其实这里的扰动可以是无数次,Bn里面包含了n个\xi无限次
扰动的平方和,\zeta_n表示有n个\xi带来的某一次扰动。此处,扰动指:在一个一致性空间中某标度\xi_k在a_k附近的波
动取值。这时我们就能指出直觉为什么不对了,因为\xi_k是随机变量不是确定量。可以把随机变量想象成每刻都在变化
闪动的数值。而对于连续的随机变量你根本没有时间看它在某刻的值是多少,除非用超级的相机拍下来。

PS:如果对一复数做平方,它的实部,看起来会被消蚀掉,因为i^2=-1,会把它实部平方和消蚀掉一部分使之小于实部的平方。
PS:
随机变量是比变量更确定,因为它的取值有分布规律约束,而变量是不受约束的。所以概率统计在现实中会有即广泛又深刻的
应用,复合随机变量亦是复合函数,求复合随机变量的分布函数,相当于求同种形式复合函数值的分布函数。

(4)\zeta_n和构成它的\xi_nk、\xi_k的特征函数
\[f_k(t)=\int_{-\infty}^{+\infty}e^{itx}dF_k(x)\]
\[\begin{alignat}{1}f_{nk}(t)=\int_{-\infty}^{+\infty}e^{itx}dF_{nk}(x)=e^{-\frac{i t a_k}{B_n}}f_k(\frac{t}{B_n})\\&\\&\\\end{alignat}\]
\[\begin{alignat}{1}f_n(t)=\int_{-\infty}^{+\infty}e^{itx}dF_n(x)&=f_{n1}(t)f_{n2}(t)f_{n3}(t)...f_{nn}(t)\\&\\ \end{alignat}\]
利用特征函数性质,用\xi_k的特征函数表示\xi_nk的特征函数,用\xi_nk的特征函数表示\zeta_n的特征函数。
           
[其余部分见藤椅]
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-8-12 15:32:50
路过,坐等大神科普。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-8-19 16:38:53

利用中心极限让一致性下差异服从标准正态分布!

[之前部分在主楼]
(5)
\xi_nk的方差和

至此,我们确知三个随机变量的期望:a_k    ,0,0
                                                 方差:b_k^2
?,1
                                          分布函数:F_nk(x)=F_k(B_n x+a_k)
                                          特征函数:f_n(t)=f_n1(t)*
f_n2(t)*f_n*(t)*...*f_nn(t)
我们最终关注n趋近无穷大时,\zeta_n的分布,\xi_nk的方差是突破口。
比较\zeta_n的方差和\xi_nk的方差和:
\[\sum_{k=1}^n D\xi_{nk}=\sum_{k=1}^n \int_{-\infty}^{+\infty}(\frac{y-a_k}{Bn})^2\,dF_k(y)=\sum_{k=1}^n \frac{1}{B_n^2} \int_{-\infty}^{+\infty}(y-a_k)^2 \,dF_k(y)=\sum_{k=1}^n \frac{{b_k}^2}{B_n^2}=1 \]
\[D\zeta_n=\int_{-\infty}^{+\infty}x^2\,dF_n(x)=1\]
我们得到两点:
\[\sum_{k=1}^n D\xi_{nk}=D\zeta_n\]
\[\lim_{k \to \infty}\frac{{b_k}^2}{{B_n}^2}=0,即\lim_{n \to \infty}\frac{b_n}{B_n}=0\]
继续发现:n无限大时\xi_nk的方差和由两重无限下的加和得到;一重就是一致空间标度数量的无穷n,我们利用它得到一个零
极限,上式;令一重是\xi_k可取值实数正负无穷之间,先固定n,观察下面极限和、极限:
\[\frac{1}{B_n^2}\sum_{k=1}^n \lim_{y \to a_k}\int_{-\infty}^{+\infty}(y-a_k)^2 \,dF_k(y)\]
\[ \lim_{y \to a_k}\int_{-\infty}^{+\infty}(y-a_k)^2 \,dF_k(y),k=1,2,...,n\]
因为\xi_k在实数上连续取值,故方差也连续取值,故上面极限、极限和都存在。

(6)\xi_k同分布时\xi_nk的方差

若则\xi_k同分布,a_k、F_k(y)不随k改变:
\[\sum_{k=1}^n \frac{1}{B_n^2} \int_{-\infty}^{+\infty}(y-a_k)^2 \,dF_k(y)=\frac{1}{B_n^2} \int_{-\infty}^{+\infty}\sum_{k=1}^n (y-a_k)^2 \,dF_k(y)=\frac{n}{B_n^2} \int_{-\infty}^{+\infty} (y-a_k)^2 \,dF_k(y)=1\]
将\xi_k的方差积分部分分三截,令\delta=\frac{B_n}{n}>0,重写上式,
\[\frac{n}{B_n^2} \int_{-\infty}^{+\infty} (y-a_k)^2 \,dF_k(y)=\frac{n}{B_n^2} \int_{|y-a_k|<\delta}^{} (y-a_k)^2 \,dF_k(y)+\frac{n}{B_n^2} \int_{|y-a_k|\ge\delta}^{} (y-a_k)^2 \,dF_k(y)\]
这时得到\xi_nk的方差和的一个不等式:
\[\begin{alignat}{1}&\frac{n}{B_n^2} \int_{|y-a_k|<\delta}^{} (y-a_k)^2 \,dF_k(y)+\frac{1}{n} \int_{|y-a_k|\ge\delta}^{}  \,dF_k(y)\leq \sum_{k=1}^n D\xi_{nk}=1\\ <&\frac{n}{B_n^2} \int_{|y-a_k|\ge\delta}^{} (y-a_k)^2 \,dF_k(y)+\frac{1}{n} \int_{|y-a_k|<\delta}{}  \,dF_k(y) \\ \end{alignat}\]
\[ \because  \int_{|y-a_k|\ge\delta}^{}\,dF_k(y)和\int_{|y-a_k|<\delta}{}\,dF_k(y)有界\]
\[\therefore \lim_{n \to +\infty}\frac{n}{B_n^2} \int_{|y-a_k|<\delta}^{} (y-a_k)^2 \,dF_k(y)<1\leq1-\lim_{n \to +\infty}\frac{n}{B_n^2} \int_{|y-a_k|<\delta}^{} (y-a_k)^2 \,dF_k(y)\]
\[\therefore \lim_{n \to +\infty}\frac{n}{B_n^2} \int_{|y-a_k|<\delta}^{} (y-a_k)^2 \,dF_k(y)=0.NB.同时, \lim_{n \to +\infty}\frac{n}{B_n^2}=0.\]
重新观察 \xi_nk的方差和极限:
\[\lim_{n \to +\infty}\frac{n}{B_n^2} \int_{-\infty}^{+\infty} (y-a_k)^2 \,dF_k(y)=\lim_{n \to +\infty}\frac{n}{B_n^2} \int_{|y-a_k|\ge\delta}^{} (y-a_k)^2 \,dF_k(y)=1=\lim_{n \to +\infty}D\zeta_n\]
得到启示:在我们规定了\zeta_n的方差之后,通过分析\xi_nk的方差和,我们清楚了当\xi_k同分布时,\xi_k上活跃度高于
均值跃动是如何被控制的。

回到一般假设:当\xi_k不同分布时,\xi_k上高于均值跃动是如何被控制的?

(7)推出林德贝格条件

同样将\xi_nk方差和中的积分分成三截,同样使用\delta=\frac{B_n}{n}
\[\sum_{k=1}^n \frac{1}{B_n^2} \int_{-\infty}^{+\infty}(y-a_k)^2 \,dF_k(y)=\sum_{k=1}^n \frac{1}{B_n^2} \int_{|y-a_k|<\delta}^{}(y-a_k)^2 \,dF_k(y)+\sum_{k=1}^n \frac{1}{B_n^2} \int_{|y-a_k|\ge\delta}^{}(y-a_k)^2 \,dF_k(y)\]
同样得到方差和的一个不等式:
\[\begin{alignat}{1}&\sum_{k=1}^n\frac{1}{B_n^2} \int_{|y-a_k|<\delta}^{} (y-a_k)^2 \,dF_k(y)+\frac{1}{n^2}\sum_{k=1}^n \int_{|y-a_k|\ge\delta}^{}  \,dF_k(y)\leq \sum_{k=1}^n D\xi_{nk}=1\\ <&\sum_{k=1}^n\frac{1}{B_n^2} \int_{|y-a_k|\ge\delta}^{} (y-a_k)^2 \,dF_k(y)+\frac{1}{n^2}\sum_{k=1}^n \int_{|y-a_k|<\delta}{}  \,dF_k(y) \\ \end{alignat}\]
取k0、K \in{1,2,3,...,n}使得
\[\int_{|y-a_{k0}|\ge\delta}^{}  \,dF_{k0}(y) \leq \int_{|y-a_k|\ge\delta}^{}  \,dF_k(y) \leq \int_{|y-a_K|\ge\delta}^{}  \,dF_K(y)\]
于是上面重写上面不等式:
\[\begin{alignat}{1}&\sum_{k=1}^n\frac{1}{B_n^2} \int_{|y-a_k|<\delta}^{} (y-a_k)^2 \,dF_k(y)+\frac{1}{n} \int_{|y-a_{k0}|\ge\delta}^{}  \,dF_{k0}(y)\leq \sum_{k=1}^n D\xi_{nk}=1\\ <&\sum_{k=1}^n\frac{1}{B_n^2} \int_{|y-a_k|\ge\delta}^{} (y-a_k)^2 \,dF_k(y)+\frac{1}{n} \int_{|y-a_K|<\delta}{}  \,dF_K(y) \\ \end{alignat}\]
\[ \because  \int_{|y-a_{k0}|\ge\delta}^{}\,dF_{k0}(y)和\int_{|y-a_K|<\delta}{}\,dF_K(y)有界\]
\[\therefore \lim_{n \to +\infty}\sum_{k=1}^n\frac{1}{B_n^2} \int_{|y-a_k|<\delta}^{} (y-a_k)^2 \,dF_k(y)<1\leq1-\lim_{n \to +\infty}\sum_{k=1}^n\frac{1}{B_n^2} \int_{|y-a_k|<\delta}^{} (y-a_k)^2 \,dF_k(y)\]
\[\therefore \lim_{n \to +\infty}\sum_{k=1}^n\frac{1}{B_n^2} \int_{|y-a_k|\ge \delta}^{} (y-a_k)^2 \,dF_k(y)=1\]
这样,我们就了解了一般情况下,\xi_k上高于均值跃动是被控制的方式。也就是林德贝格条件。

将\xi_k的方差表达式写回至\xi_nk的方差表达式:
\[ \lim_{n \to +\infty}\sum_{k=1}^n\frac{1}{B_n^2} \int_{|y-a_k|\ge \delta}^{} (y-a_k)^2 \,dF_k(y)=\lim_{n \to +\infty}\sum_{k=1}^n \int_{|y-a_k|\ge \delta}^{} x^2 \,dF_{nk}(x)=1\]
总结:我们利用\zeta_n方差=1和\zeta_n方差等于\xi_nk方差的和这两个条件,返回出它们对\xi_k和\xi_nk的限制。\zeta_n
和\xi_nk的特征函数之间关系的条件还没利用。

(8)推n无穷大时\zeta_n的分布表达式

\[即F_n(x)=\lim_{n \to +\infty}P\{\zeta_n<x\}=\int_{-\infty}^{x}p_n(y)\,dy=\int_{-\infty}^{x}\frac{1}{2\pi}\int_{-\infty}^{+\infty}p_n(y) e^{iyt}\,dy \,dt\]

---------------------------------以下是草稿------------------------------------------------------------------------------------------------------
1.为什么要关注f_nk-1在从1到n的加和
能够利用的几个条件:
1.方差和等于中心附近的方差和
2.特征函数积等于特征函数
3.积相减的绝对值小于分量差绝对值的和
4.指数展开式的无穷小量是正的无穷小量
5.随机变量的和特征函数与原随机变量特征函数的形式关系

图示:\xi_k的中心极限



-----------------------------------------------------------------------------------------------------------------------------------------------------------
\[引理1:对任意n=1,2,..及任意t,|g_n(t)|=\left|e^{it}-1-\frac{it}{1!}-...-\frac{(it)^{n-1}}{(n-1)!}\right| \leq \frac{|t|^n}{n!}\]
\[证明关键有三点:(1)g_1(t)=i\int_{0}^{t} e^{ix}\,dx,(2)g_n(t)=i\int_{0}^{t} g_{n-1} (x)\, dx ,(3)|g_1(t)|\leq t,然后用归纳法, \]
\[证明(3):先令t>0,\begin{alignat}{1}|g_1(t)|&=|e^{it}-1|=|\cos t+i \sin t -1|=\sqrt{(\cos t-1)^2+\sin^2 t }=\sqrt{2} \sqrt{2 \sin^2 \frac{t}{2}}\\&=2\sin\frac{t}{2} \leq t\\ \end{alignat}\]
\[\therefore |g_n(t)| \leq \frac{|t|^n}{n!},又因为\bar{|g_n(t)|}=|g_n(t)|,\therefore 对于任何t有左边的式子成立。\]
-----------------------------------------------------------------------------------------------------------------------------------------------------------
\[引理2:对于任何|a_k| \leq 1及|b_k|\leq 1 (k=1,2,3,...,n)的复数,有|a_1 a_2 ... a_n - b_1 b_2 ... b_n|\leq \sum_{k=1}^n |a_k -b_k|\]
\[因为a_1a_2-b_1b_2=(a_1-b_1)a_2 + (a_2-b_2)a_1\\所以|a_1a_2-b_1b_2|=|a_1-b_1||a_2|+|a_2-b_2||a_1|\leq |a_1-b_1|+|a_2-b_2|\]
\[再利用数学归纳法有,\\|a_1a_2a_3-b_1b_2b_3|=|a_1a_2-b_1b_2||a_3|+|a_3-b_3||a_1b_1| \\ \leq |a_1a_2-b_1b_2|+|a_3-b_3|\leq |a_1-b_1|+|a_2-b_2|+|a_3-b_3|\]
\[推广到n即得到要证的式子。\]
----------------------------------------------------------------------------------------------------------------------------------------------------------
\[引理3:若\varphi(t)是特征函数,那么e^{\varphi(t)-1}也是特征函数,特别地,|e^{\varphi(t)-1}|\leq1。\\证明:定义随机变量\eta=\xi_1+\xi_2+...+\xi_\nu,其中\xi_1,\xi_2,...相互独立,均有特征函数\varphi(t),\nu服从\\参数\lambda=1的泊松分布,且与诸\xi_i独立,此时\eta 的特征函数:\]
如何理解一个复合的随机变量 \eta,如何求复合的随机变量的特征函数。
\nu服从泊松分布,表示它是
\[\begin{alignat}{1}
&P\{\nu=1\}=\frac{1}{e},\eta=\xi_1,\varphi_{\eta1}=\varphi(t),F_{\eta1}\\
&P\{\nu=2\}=\frac{1}{2! e },\eta=\xi_1+xi_2,\varphi_{\eta2}=\varphi^2(t)\\
&P\{\nu=3\}=\frac{1}{3! e},\eta=\xi_1+xi_2+\xi_3,\varphi_{\eta3}=\varphi^3(t)\\
&...,\\
&P\{\nu=k\}=\frac{1}{k! e},\eta=\xi_1+xi_2+\xi_3+...+\xi_k,\varphi_{\etak}=\varphi^k(t)\\
&...,\\
\varphi_{\eta\nu}=?\end{alignat}\]

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-8-19 20:46:27
赞叹楼主的帖子编辑能力,尤其是LaTeX用得真好;当然,内容也相当不错
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-8-19 21:18:20
yangyuzhou 发表于 2014-8-19 20:46
赞叹楼主的帖子编辑能力,尤其是LaTeX用得真好;当然,内容也相当不错
程士宏《测度论》第六章有更加一般的中心极限定理的证明。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-8-19 21:21:00
yangyuzhou 发表于 2014-8-19 20:46
赞叹楼主的帖子编辑能力,尤其是LaTeX用得真好;当然,内容也相当不错
https://bbs.pinggu.org/thread-445493-1-1.html
第六章有更加一般的中心极限定理的证明
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群