全部版块 我的主页
论坛 经济学人 二区 外文文献专区
1149 15
2022-06-01
英文标题:
《On the overestimation of the largest eigenvalue of a covariance matrix》
---
作者:
Soufiane Hayou
---
最新提交年份:
2017
---
英文摘要:
  In this paper, we use a new approach to prove that the largest eigenvalue of the sample covariance matrix of a normally distributed vector is bigger than the true largest eigenvalue with probability 1 when the dimension is infinite. We prove a similar result for the smallest eigenvalue.
---
中文摘要:
本文用一种新的方法证明了当维数为无穷大时,正态分布向量样本协方差矩阵的最大特征值大于概率为1的真最大特征值。对于最小特征值,我们证明了类似的结果。
---
分类信息:

一级分类:Mathematics        数学
二级分类:Probability        概率
分类描述:Theory and applications of probability and stochastic processes: e.g. central limit theorems, large deviations, stochastic differential equations, models from statistical mechanics, queuing theory
概率论与随机过程的理论与应用:例如中心极限定理,大偏差,随机微分方程,统计力学模型,排队论
--
一级分类:Mathematics        数学
二级分类:Statistics Theory        统计理论
分类描述:Applied, computational and theoretical statistics: e.g. statistical inference, regression, time series, multivariate analysis, data analysis, Markov chain Monte Carlo, design of experiments, case studies
应用统计、计算统计和理论统计:例如统计推断、回归、时间序列、多元分析、数据分析、马尔可夫链蒙特卡罗、实验设计、案例研究
--
一级分类:Quantitative Finance        数量金融学
二级分类:Mathematical Finance        数学金融学
分类描述:Mathematical and analytical methods of finance, including stochastic, probabilistic and functional analysis, algebraic, geometric and other methods
金融的数学和分析方法,包括随机、概率和泛函分析、代数、几何和其他方法
--
一级分类:Statistics        统计学
二级分类:Statistics Theory        统计理论
分类描述:stat.TH is an alias for math.ST. Asymptotics, Bayesian Inference, Decision Theory, Estimation, Foundations, Inference, Testing.
Stat.Th是Math.St的别名。渐近,贝叶斯推论,决策理论,估计,基础,推论,检验。
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-6-1 05:54:31
关于高估协方差矩阵的最大特征值的问题,巴黎理工学院应用数学系,soufiane Hayou。hayou@polytechnique.eduAbstract.在本文中,我们使用一种新的方法证明了当维数为有限时,正态分布向量样本协方差矩阵的最大特征值大于概率为1的真实最大特征值。关键词:协方差矩阵、线性代数、随机矩阵理论1简介众所周知,当样本数与变量维数相比较大时,可以使用样本协方差矩阵精确估计相关矩阵:设p为维数,n为样本数,(Xi)1≤我≤t观察结果。样本协方差矩阵定义为:S=nnXi=1(Xi-\'\'X)(Xi)-其中X是X的转置,\'X是经验平均值。然而,当p与n相同时,样本协方差矩阵不是一个好的估计量。实际上,我们经验观察到,样本协方差矩阵倾向于对一大类协方差矩阵的最大(最小)特征值进行过度估计(低估)。关于这个主题有大量的研究论文。我们发现(一般而言)拟议方法有三大类:收缩到目标(如Ledoit和Wolf[4])、随机矩阵理论(N.El Karoui[5]、Bouchaud和Bun[3])和优化欠约束(如在[6]等条件数的约束下)。特别是,在[2]中已经证明,在极限谱(极限密度)的某些条件下,当p趋于完整(pn一致有界)时,最大样本特征值具有Tracy-Widom分布。利用这一点,我们可以很容易地证明,在这种情况下,概率1,我们高估了最大特征值。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 05:54:34
然而,这些条件有时很难验证,并且[2]中的有效条件对经验密度施加了限制密度。我们的目标是克服这个问题,并在频谱上提供一些容易验证的条件,而不受任何限制。在本文中,我们使用文献[1]中关于最大特征值概率分布上界的结果表明,在某些假设下,当维数变为整数时,事件{样本的最大特征值>真协方差矩阵的最大特征值}的概率收敛到1。下面,S是样本协方差矩阵,∑是真协方差矩阵,l≥ l≥ ... ≥ lps的特征值λ≥ λ≥ ... ≥ λp∑和q=pn<1的特征值是维数与样本量的比值。在第一节中,我们介绍了随机矩阵理论中关于Wishart矩阵(Chi平方分布的多维推广)的一些经典结果,我们展示了第2节和第3.2节中Wishart矩阵的主要结果以及特征值的分布。在这一节中,我们展示了Wishart分布以及随机矩阵理论中的一些相关结果。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 05:54:37
我们首先回顾Wishart矩阵的定义。定义:如果存在X,则p×p矩阵M称为具有协方差矩阵∑和自由度n的Wishart分布~ Nn×p(u,∑),使得M=XtX。我们用M表示~ Wp(n,∑)。当n≥ p、 Wishart分布的密度函数为:f(M)=-np/2Γp(n/2)(det(∑))n/2etr(-Σ-1M)(detM)(n-p-1) /2(1)其中etr是轨迹的指数,Γpis是广义伽马函数。当X~ Nn×p(u,∑),样本协方差矩阵S=nxxt具有Wishart分布Wp(n- 1,n∑)(证明见【11】。2.1特征线M的联合分布~ Wp(n,∑),其中n>p,则特征值l的联合分布≥ l≥... ≥ lpis由(见【11】)给出:g(l,l,…,lp)=πp/2×2-np/2(det∑)-n/2Γp(n/2)Γp(p/2)pYi=1l(n-p-1) /2ipYj>i(li-lj)佐佩特(-Σ-1HLHt)(dH)(2)式中,L=diag(L,L,…,lp),且积分在关于Haar测度的正交群Op上(见[8])。一般来说,积分很难估计。然而,当∑=λI时,我们有:ZOpetr(-Σ-1HLHt(dH)=佐佩特(-2λHLHt)(dH)=etr(-2λL)ZOp(dH)=exp(-2λpXi=1li)Haar测度是旋转不变的,这意味着对于任何正交矩阵Q,one有:d(QH)=dh利用这一点以及存在正交矩阵Q的事实,∑-1=QD-1qt当D=diag(λ,λ,…,λp)时,我们可以证明先前的分布仅取决于∑的特征值。我们知道S~ Wp(n-1,n∑),所以特征值l的联合分布≥ l≥...
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 05:54:40
≥ 样本协方差矩阵的lpof由以下公式给出:g(l,l,…,lp)=πp/2(det∑)-(n)-1) /2Γp((n- 1) /2)Γp(p/2)(n- 1) p(n-1) pYi=1l(n-p-2) /2ipYj>i(li-lj)佐佩特(-n∑-1HLHt)(dH)2.2样本协方差矩阵最大特征值的分布S最大特征值的累积分布函数由以下公式给出:P(l<x)=ΓP(P+1)ΓP(P+n)det(n- 1Σ-1) (n)-1) /2F1,1(n- 1.氮+磷;-nx∑-1) (3)其中F1,1是具有矩阵参数的超几何函数(见[9])。这个函数很难计算,这使得前面的公式很难直接使用。下一个结果由R.J.Murhead在[1]中首次证明。定理I(Muirhead):设x为非负实数。下列不等式适用于任何p和n,使得p<n:p(l≤ x)≤pYi=1P(χn≤nxλi)(4)P(lp≤ x)≥ 1.-pYi=1P(χn≥nxλi)(5),其中χnis是具有n个自由度的卡方随机变量。由于发现超几何函数的边界仍然是一个有趣的主题,我们无法完全检查该边界的质量(唯一的检查方法是通过模拟)。2.3特例:Marchenko Pastur分布当∑=I时,Marchenko Pastur定理表明,样本特征值的经验分布在p→ ∞ (q=pn固定)到Marchenko Pasturd分布,由:mp(x)=2πp(λ)给出+- x) (十)- λ-)qxλ-≤x个≤λ+式中λ+=(1+√q) 和λ-= (1 -√q) 。图1显示了q=0.1时的Marchenko Pastur分布。图1:。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 05:54:42
Marchenko Pastur分布q=0.13高估了最大特征值。在本节中,我们证明了在某些约束条件下,当维数变为整数(q=pn固定)时,事件l>λ的概率收敛到1。为了证明结果,将证明以下引理。引理1:Let(Ohm, P、 F)是概率空间,和(An),(Bn)两个事件序列(不必独立),limn→∞P(Bn)=1,那么我们有:lim supn→∞P(An∩ Bn)=lim supn→∞证明:我们有,P(An)∩ Bn)=P(An)+P(Bn)- P(An∪ Bn)并使用P(An∪ Bn)≥ P(Bn)和P(Bn)→ 1,我们得出结论。引理2:设χnbe是一个具有n个自由度的卡方随机变量,(an)是一系列正实数。然后对于任何递增和连续函数f和 > 0,我们有:lim supn→∞f(P(N(0,1))≤√n(an)-1)-)) ≤ lim支持→∞f(P(χn≤ nan))≤ lim支持→∞f(P(N(0,1))≤√n(an)-1)+))(7) 和lim supn→∞f(P(N(0,1))≥√n(an)-1)+)) ≤ lim支持→∞f(P(χn≥ nan))≤ lim支持→∞f(P(N(0,1))≥√n(an)-1)-))(8) 证明:我们知道χn=dZ+Z+…+ZNHERE(Zi)1≤我≤nare标准正态变量(分布相等)。由于高斯变量具有任意阶矩,我们可以使用中心极限定理,我们有:√n(χnn- (1)→dN(0,1)我们可以这样写:χnn=d1+√新西兰+√nn(9),其中Z~ N(0,1)和n=外径(1)(odmeansnConverge为0(分布)。我们知道,分布收敛到常数意味着概率收敛到同一常数。也就是说,我们可以写n=oP(1)。现在让我们 > 0
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群