全部版块 我的主页
论坛 经济学人 二区 外文文献专区
2022-6-15 15:54:36
递归技术【107】、费曼图扩展【66】、副本(参见【21】或上文第2.4节的泛化)或自由概率。我们将介绍最后一种方法,这可能是推导MP方程的最简单方法。关键的观察结果是,对于线性模型,我们总是可以使用公式(3.4)asE重写E=√CW公司√C、 W..=XX号*,其中,矩阵X满足等式(3.5),且与C无关。由于E是cw与N的white-Wishart核的自由乘法卷积,因此该模型属于第2.3节中遇到的自由乘法模型→ ∞ [108]. 因此,E的Stieltjes变换精确地由公式(2.84)给出,我们专门化为zge(z)=z(z)gC(z(z)),其中z(z)…=zSW(zgE(z)- 1). (3.9)此外,在等式(2.44)中获得了W的S变换,即SW(z)=(1+qz)-1对于任何q>0。因此,我们可以将Z(Z)重新表示为:Z(Z)=z1-q+qzgE(z),(3.10),这正是马伦科·帕斯托自洽方程,它将E和C的斯蒂尔捷斯变换联系起来。值得注意的是,等式(3.9)的RHS是“确定性的”,因为C在这个框架中是执行的。请注意,该方程通常以等效形式写入数学和统计文献中:gE(z)=zρC(u)duz-u(1 - q+qzgE(z))。(3.11)有两种方法可以解释上述Marˇcenko Pastur方程:1。“直接”问题:我们知道C,我们想计算经验相关矩阵的期望特征值密度ρeo;“逆”问题:我们观察E,并试图推断出满足方程(3.9)的真实C。显然,反问题是许多统计应用程序感兴趣的问题之一,但由于gCfrom GEI之间的映射在数值上不稳定,因此比直接问题更难解决。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:54:39
尽管如此,El Karoui【32】和最近Ledoit&Wolf【109】的工作允许人们通过数值方案在这一方向上取得进展,该数值方案解决了方程(3.11)中反问题的离散化版本。另一方面,直接问题会导致一个自洽方程,对于gC的某些特殊形式,该方程可以用数值方法精确求解,有时也可以用解析方法求解(见下一节)。最后,让我们说一句我们以前没有在文献中看到过的话。增强Z(Z)到Z(Z,q)以强调其对q的依赖,可以检查该对象是否遵守以下simplePDE【110】:qZ(Z,q)q=(Z(Z,q)- z)Z(Z,q)z、 (3.12)初始条件为z(z,q→ 0)=z+qz(1- zgC(z))。这种表述可以给出直接的解释,但它在数值上或分析上是否有用还有待观察。3.2.2. 样本协方差矩阵的谱统计。出于统计目的,MarˇcenkoPastur方程提供了一个非常强大的框架来理解大维样本协方差矩阵的行为,尽管反问题不是数字系统。正如我们将在本节中看到的,我们可以利用矩母函数推断出E的谱的许多性质,知道C的谱。回想一下式(2.21)中T变换的定义,很容易看出我们可以重写式(3.9)asTE(z)=TC(z(z)),z(z)=z1+qTE(z)。(3.13)我们从公式(2.22)中知道,T变换可以表示为z的幂级数→ ∞, hencewe haveTE(z)=z→∞∞Xk=1Д(Ek)z-k、 (3.14)式中Д(.)=N-1Tr(.)是规范化跟踪运算符。我们由此推导出z(z)=z→∞z1+qP∞k=1Д(Ek)z-k、 所以我们有z→ ∞TC(Z(Z))=Z→∞∞Xk=1Д(Ck)zk1+q∞X`=1И(E`)z-`!k
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:54:42
(3.15)总之,可以将ρew的力矩与ρCby的力矩联系起来,取z→ ∞ 在公式(3.13)中∞Xk=1Д(Ek)zk=∞Xk=1Д(Ck)zk1+q∞X`=1И(E`)z-`!k、 (3.16),首次在【66】中获得。特别是,我们从公式(3.16)中推断,ρEsatisfyД(E)=Д(C)=1Д(E)=Д(C)+qД(E)=Д(C)+q(3.17)的前三个动量,因此,我们看到E的LSD方差等于C加q的方差,也就是说,样本协方差矩阵e的谱总是比总体协方差矩阵C的谱宽(q>0)。这是另一种说服我们自己,e是高维区域中C的噪声估计量的方法。请注意,我们还可以用累积量展开来表示Marˇcenko Pastur方程。事实上,我们可以根据R变换重写等式(3.9)(参见下面的推导)ωRE(ω)=ζ(ω)RC(ζ(ω)),ζ(ω)=ω1+qωRE(ω). (3.18)使用公式(2.19)中给出的R变换的累积量展开,我们得到ω→ 0ωRE(ω)=∞X`=1κ`(E)ω\',(3.19)和ζ(ω)RC(ζ(ω))=∞X`=1κ`(C)ω\'1+q∞Xm=1κm(E)ωm!`。(3.20)通过将最后两个方程式重新组合成方程式(3.18),方程式(3.16)中自由累积量的模拟值如下:∞X`=1κ`(E)ω`=∞X`=1κ`(C)ω\'1+q∞Xm=1κm(E)ωm!`,(3.21)这将允许我们用C的累积量来表示E的累积量。另一个有趣的扩展是q<1的情况,这意味着E是可逆的。因此g(z)表示z→ 0是解析的,可以很容易地找到(z)=z→0-∞Xk=1Д(E-k) zk公司-1.(3.22)这样可以研究E的LSD力矩-1事实证明,这是许多应用程序的一个重要数量(见第7章)。使用公式(3.9),我们实际上可以将频谱E的动量联系起来-1至C-1作为一个人,对于z→ 0:Z(Z)=z1-q- qP公司∞k=1Д(E-k) zk。因此,我们得到以下等式的展开式。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:54:45
(3.9)在z→ 0和q∈ (0, 1):∞Xk=1Д(E-k) zk公司=∞Xk=1Д(C-k) z1级-qk1级-第一季度-qP公司∞`=1^1(E-`)z `!k、 (3.23)这比产生力矩的展开式(3.16)或累积展开式(3.21)要麻烦一些。尽管如此,我们得到的领先顺序是-1) =^1(C-1)1 -q、 ^1(E-2) =^1(C-2)(1 -q) +q^1(C-1)(1 -q) 。(3.24)我们将在第7.1节中看到,第一个关系(可在[66]中找到)对优化投资组合的样本外风险有直接影响。现在让我们给出公式(3.18)的形式推导。让我们定义ω=gE(z),ζ=gC(z),(3.25),这允许我们将等式(3.9)重写为ωBE(ω)=ζBC(ζ),z≡ BC(ζ)=BE(ω)1- q+qωBE(ω)。(3.26)然后,利用R变换的定义(2.16),我们可以将最后一个方程改写为ωRE(ω)=ζRC(ζ),RC(ζ)+ζ=RE(ω)+1/ω1+qωRE(ω)。(3.27)我们推导出rc(ζ)=RE(ω)+1/ω1+qωRE(ω)-ζ、 (3.28)产生ωRE(ω)=ζRE(ω)+1/ω1+qωRE(ω)-ζ!. (3.29)通过重新排列最后一个方程中的项,我们得到ωre(ω)+1=ζωre(ω)+11+qωre(ω)!,(3.30)即ζ≡ ζ(ω) = ω1+qωRE(ω), (3.31)和等式(3.18),然后将最后一个等式插入等式(3.28)。3.2.3. 谱的对偶表示和边。虽然可以从Marˋcentko Pastur方程(3.9)中收集到许多关于E光谱的信息,但方程本身并不容易解析求解。特别是,关于E的光谱边缘可以说些什么?我们将看到,通过使用等式(3.9)的双重表示,可以回答其中一些问题。我们所说的“对偶”表示来自于对T×T矩阵的研究:S:=TY*Y≡ 十、*CX,(3.32),其中我们使用了上一个等式中的等式(3.4)。对偶矩阵S也可以解释为相关矩阵。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:54:48
在财务方面,E告诉我们两支股票在加班时的走势有多相似,而S告诉我们两支股票在这两个特定日期的整体走势有多相似。使用奇异值分解,不难证明Sand E共享相同的非零特征值,因此具有“对偶性”。在T>N的情况下,矩阵S有一个重数为T的零特征值- N除了特征值{λi}i之外∈[1,N]ofE。因此,很容易推导S:gS(z)=T的Stieltjes变换T- 新西兰+NgE(z)=1.-qz+qgE(z)=z(z)。(3.33)引入经验矩阵的这种双重表示,可以从公式(3.11)中得到以下表达式:gS(z)=z1.-q+qZρC(u)du1-ugS(z).经过一些操作后,我们可以重写最后一个方程,即z=gS(z)+qZρC(u)du-1.- gS(z)。(3.34)将ω=BS(gS(z))写到上述方程中,我们得到了gSasBS(ω)函数逆的一个特征:=ω+qZρC(u)du-1.- ω、 (3.35)这是Marˇcentko Pastur方程(3.9)的对偶表示。这最后一个方程的分析行为一直是一些研究的主题,尤其是在[29]中。特别地,证明了存在唯一ω∈ C+求解方程(3.35)。这就产生了S的Stieltjes变换,从中我们使用公式(3.33)重新获得了E的Stieltjes变换。我们将在下一节中看到,当我们试图解决直接问题时,Marˇcentko Pastur方程的对偶表示(3.35)特别有用。此外,可以根据公式(3.35)推断出E的LSD边缘的位置。在一次切割假设下,ρEare的支撑边缘由以下公式给出:λE±=BS(ω±),其中ω±∈ R+使得BS(ω±)=0。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:54:51
(3.36)事实上,知道S的光谱密度可以让我们得到E的光谱密度,因为从等式(3.33)可以得到:ρS(λ)=qρE(λ)+(1- q) +δ,(3.37)对于任何λ∈ 补充ρS。接下来,一个容易获得的S(z)=-ZρS(x)dx(Z-x) <0,(3.38)对于任何z 6∈ supp【ρS】,意味着它在支撑之外严格减小。我们在第2.1.2节中看到,Stieltjes变换g(z)对于任何z都是解析的和正的∈ R支架外侧。此外,对于z→ ∞, 我们有gS(z)~ z-1+O(z-2) 因此,我们推导出gS(z)是一个无向递减函数。因此,它的反函数B在相同的时间间隔内也会减小。因此,BS(x)减少的区间的并集将导致支撑的补充,ρs的支撑边缘由BS的临界点给出,如上文等式(3.36)所示。如果假设存在数量有限的(非退化)尖峰,我们可以很容易地概括上述参数,并发现将有2个(r+1)临界点(两个非退化尖峰的说明见图3.1)。3.2.4. 求解Marˇcenko Pastur方程。在本节中,我们研究了求解Gegive gC的Marˇcentko Pastur方程方程式(3.9)的直接问题。我们将在本节末尾简要讨论反向问题。图3.1:。总体特征值密度为0.002δ+0.002δ+0.396δ+0.3δ1.5+0.3δ的函数BE(x)。这里T=1000,N=500,我们有3个连接的组件。垂直渐近线位于-x个-1对于x∈ {1, 1.5, 3, 8, 15}. ρSis的支撑在纵轴上用蓝色粗线表示。红色绘制的gS | R\\suppρSis的倒数。完全可解的情况。据我们所知,只有少数情况下我们可以找到E。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:54:54
第一个是无关紧要的:当我们考虑统计中的“经典”极限时,T→ ∞ 对于N的固定值。在这种情况下,q=0 In(3.11),在这种情况下,明显的lyge(z)=gC(z),如预期的那样。然而,对于任何有限观测比q>0,我们从上文第3.2.2节的讨论中预计,E的LSD将与C的LSD显著不同。在C=in的简单情况下,可以很好地理解q的影响。我们从第2.2.3节知道,这种情况是完全可解的,E的LSD是众所周知的Marˇcentko Pastur定律(2.42),我们在这里重新命名:gE(z)=z+1- q-qz公司-λmp-qz公司-λmp+2qz,λmp±=(1±√q) (3.39)换句话说,样本特征值跨越区间[(1-√q) ,(1+√q) 而总体特征值都等于一。因此,我们推断样本特征值分布的方差为q阶,突出了当q=O(1)时,特征值估计中的系统偏差。这种影响可以使用光谱分布的分位数表示进行可视化。事实上,自[97111]以来就知道,体特征值[λi]i∈[[r+1,N]]在图3.2中收敛。在单位观测比q=0.25(红线)和q=0.5(蓝线)的情况下,Marˋcentko Pastur定律(2.42)下样本特征值的典型位置。虚线对应于总体特征值的位置,我们看到了显著的偏差。高维区域到它们的“分位数位置”[γi]i∈[[r+1,N]]。更准确地说,这是:λi≈ γi,其中=ZγiρE(λ)dλ,i>r+1。(3.40)我们在图3.2中绘制了q=1/4和q=1/2的马申科-帕斯图尔定律的γi,并观察到与“经典”位置γq=0i的系统和显著偏差≡ 1.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:54:58
这再次说明,当样本大小与变量数量具有相同的数量级时,E是一个不可靠的估计量。既然已经很好地理解了观测比q的定性影响,自然的扩展是检查非平凡相关矩阵C的Marˋcenko Pastur方程。为此,我们现在考虑另一个有趣的可解情况,尤其是统计推断,即超参数κ>0的(各向同性)逆Wishart矩阵的情况。从第2.2.4节中,我们回忆起sc(ω)=1-ω2κ,对于κ>0。然后,使用自由乘法公式(2.81),我们得到了SE(ω)=SC(ω)SW(ω),其中SW(ω)在(2.44)中给出,这在TE(z)中产生了一个二次方程。这意味着gEreads:gE(z)=z(1+κ)- κ(1 - q) ±p(κ(1-q)- z(1+κ))- z(z+2qκ)(2κ+1)z(z+2qκ),(3.41),我们可以从中检索支架的边缘:λiw±=κh(1+q)κ+1±p(2κ+1)(2qκ+1)i.(3.42)图3.3。当C是反向Wishart矩阵,q=0.25(红线)和q=0.5(蓝线),参数κ=1.0时,E特征值分布的Marˇcenko Pastur方程的解。黑色虚线对应于LSDρC。可以检查极限κ→ ∞ 在C=IN的情况下恢复无效假设;κ越低,C的光谱越宽。我们在图3.3中绘制了q=0.25和q=0.5时的光谱密度ρCandρefo,作为特征值的函数。我们再次看到,由于测量噪声,E的光谱密度在ρC支撑之外的实轴区域上施加了显著的权重。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:55:01
从推理理论的角度来看,逆Wishart系综的目的是为C提供一个参数先验分布,其中所有内容都可以通过分析计算得出(某些应用见下文第5章)。还有其他几个例子表明,即使Tieltjes变换不是显式的,Marˇcentko Pastur方程也是完全可解的。例如,如果我们认为C是参数qindependent from W的Wishart矩阵,那么我们从(2.81)得到se(ω)=(1+qω)(1+qω)。然后很容易从定义(2.23)中看出TE(z)≡ ω(z)是三次方程的解,z(1+ω(z))(1+qω(z))(1+qω(z))- ω(z)=0,(3.43),根据(2.21)并通过选择后一个方程的唯一解inC+(有关这一点的详细信息,请参阅下一节),我们从中获得gE(z)。另一个将Marˇcenko Pastur与R变换形式结合使用的玩具示例是,C是以单位矩阵为中心的GOE。在这种情况下,wehaveRC(ω)=1+σω,(3.44),其中我们添加了约束σ6 0.5,使得C保持为正半限定矩阵。然后,通过将该公式插入(3.18),我们发现gE(z)=ω是四次方程的解:σω(1+qωRE(ω))+ω(1+qωRE(ω))- ωRE(ω)=0,(3.45),如上所述,我们在C+中取唯一解,以得到正确的Stieltjes变换。一般情况:数值方法除了上述非常特殊的情况外,很难找到gE(z)的显式表达式。这意味着我们必须求助于数值模式来解决Marˇcentko Pastur方程。在这方面,等式(3.9)的双重表示(3.35)尤其有用。要求解给定z的MP方程,我们可以看到某个g≡ gsz=BS(g),g∈ C+,(3.46),其中Bs在ρCis方面的表达式明确,并在公式(3.35)中给出。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:55:05
在数值上,上述方程可以使用简单的梯度下降算法轻松求解,即find g∈ C+(Re(z)=ReBS(g)Im(z)=ImBS(g).(3.47)然后使用公式(3.33),以获得任意z的gE(z)∈ C-. 因此,如果想要在实线上的任何一点上检索特征值密度ρ,我们只需设置z=λ- iε与λ∈ 将任意小实数正数Supp(E)和ε代入式(3.47)。注意,在gc已知的情况下,可以重写方程(3.35)asBS(x)=x1.-q+qxgCx个, (3.48),这显然更有效,因为我们避免了计算特征值上的积分。为了说明这个数值格式,让我们考虑一个协方差矩阵,它的LSD有一个重右尾。一种可能的参数化方法是假设幂律分布的形式为[28]:ρC(λ)=sA(λ+λ)1+sΘ(λ-λmin),(3.49),其中Θ(x)=x+是Heaviside阶跃函数,s是我们选择为s=2的指数[28],λmin是谱的下边缘,在该下没有C的特征值。A,λminarethen由两个归一化约束rρC(x)dx=1和rxρC(x)dx=1确定。这导致:λmin=(1-λ) /2和A=(1-λmin)。我们限制到λ>-11使得λmin<1。根据密度公式(3.49),可以直接执行Stieltjes变换,以确定Gc(z)=z+1- 2λ+2(1 -λ) (z+1- 2λ)+2(1 -λ) (z+1- 2λ)日志λ- z1级-λ, (3.50),只需几次迭代即可求解公式(3.48)。正如我们在图3.4中所观察到的,从数值格式(3.47)中获得的理论值与通过对大小为N=500的矩阵进行对角化得到的经验结果完全一致,这些矩阵如下所示:√CW公司√C、 其中W是Wishart矩阵。这说明了上述数值格式的鲁棒性,即使C的谱是厚尾的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:55:10
此外,我们可以注意到,我们在真协方差C中添加的结构越多,经验分布就越宽,就像上面的情况一样,其中E的谱几乎包含所有的正实数线。回想一下,S是方程式(3.32)中定义的T×T当量。0 1 2 3 45 67λ00.511.5ρ(λ)信号样本35 36 37 38 39 40 41 42 43 441.2×10-51.6×10-52.0×10-52.4×10-52.8×10-5图3.4。当ρCis给定幂律密度,参数λ=0.3,有限观测比q=0.5,N=500时,Marˇcenko Pastur方程的分辨率。虚线对应C的LSD,而平线对应E的LSD。当我们从定义(3.3)计算EFR时,直方图是ESD。主图覆盖了大部分特征值,而插图放大了非常大的特征值区域。3.3. 边缘和异常值统计信息。正如我们在上文多次提到的,随机矩阵特征值谱的理论预测的实际有用性是:(i)其对基础随机变量分布的普遍性,以及(ii)谱中出现锐边,这意味着,存在的特征值位于允许的区域之外,这可能是对简单的“零假设”基准的一种指示。图3.5显示了对应于N=406和T=1300的相关矩阵的经验光谱密度,以说明最后一点,因此q≈ 0.31,与零假设情况下最简单的Marˇcentko Pastur谱C=in相比。虽然大致解释了大部分分布(但请参见第7.2节了解更好的尝试),但似乎存在一定数量的特征值,这些特征值位于Marˋcentko Pastur海外侧,可称为异常值或峰值。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:55:14
然而,即使在C的光谱中没有这样的尖峰,我们也会看到,在玛尔岑科牧场上边缘以外的一些特征值。接下来的两小节首先讨论这些有限尺寸效应,然后讨论一个具有“真实”异常值的模型,该异常值存在于大N限值中。3.3.1. 特蕾西·维多姆地区。这种锐利边缘的存在界定了一个区域,在这个区域中,人们期望从一个应该没有特征值的区域中看到一个非零密度的特征值,这种情况只在渐近N,T中成立→ ∞, 并且在矩阵元素分布中没有“厚尾”(见[73112])。另一方面,对于较大但有限的N,我们预计找到0 1 2 3 4λ0.00.51.0ρ(λ)经验数据的概率Marcenko Pastur图3.5。使用n=406和T=1300的美国股票数据对经验相关矩阵E的零假设进行检验。Marˇcentko Pastur海以外的特征值非常小但有限。过渡区的宽度和态密度的尾部在不久前就已经被研究过了【113】,Tracy和Widom在随机矩阵的最大特征值分布上得出了漂亮的结果【26】。特蕾西·维多姆的结果实际上是普遍现象的一个很好的体现,它描述了许多大维度系统中宏观可观测物的变化(见最近关于这个主题的论文【114】。Tracy-Widom分布的推导主要依赖于我们在本综述中不会讨论的正交多项式(参见[26115]),但也存在另一种方法[116]。这一极限定律与大样本协方差矩阵的最大特征值之间的联系已经受到了大量研究的影响,我们将不在这里尝试讨论(参见。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:55:17
[25、50、51、117、118、119]以获取详细信息和参考)。Tracy-Widom结果精确地描述了E的最大特征值λ与我们用λ+表示的光谱上边缘之间的距离。这个结果可以(正式)表述如下:λ的重标度分布- λ+向Tracy-Widom分布收敛,通常表示为F,Pλ6λ++γN-2/3u= F(u),(3.51),其中γ是一个常数,取决于问题。对于各向同性Marˋcenko Pastur问题,λ+=(1+√q) 和γ=√qλ2/3+,而对于Wigner问题,λ+=2,γ=1。我们强调,这一结果适用于一大类N×N矩阵(例如,具有有限四阶矩IID元素的对称随机矩阵,见[112,73])。关于Tracy Widom密度f(u)=f(u)的一切都是已知的,特别是它的左、右远尾:ln f(u)∝ -u3/2,(u→ +∞); ln f(u)∝ -|u |,(u→ -∞); (3.52)人们注意到,左尾要薄得多:将最大本征值推到允许带内意味着压缩排斥电荷的整个库仑气体,这很困难。利用这个类比,Tracy-Widom问题的大偏差区域(即λ-λ+=O(1))也可以得到[50]。注意,最小特征值λmina在下边缘λ周围的分布-除q=1的Marˇcenko Pastur矩阵的特殊情况外,它也是一个三态Widom。在这种情况下,λ-= 0是一个“硬边”,因为经验矩阵的所有特征值都必须是非负的。例如,在[120]中处理了这种特殊情况。3.3.2. 异常值统计。现在,即使在N→ ∞.例如,图3.5所示的经验数据确实表明存在真实的异常值,这些异常值对经济活动部门具有真实的财务解释。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:55:23
因此,我们需要一个框架来描述同时包含一个大区域和一个有限数量的尖峰的相关矩阵。本节的目的是从RMT的角度研究这些特征值的统计信息。处理异常值的标准方法是“吹出”给定(无尖峰)相关矩阵C的有限个特征值,我们将其构造为:C=NXi=1uiviv*i、 式中,ui=(uif i 6 ruiif i>r+1。(3.53)我们选择C光谱中的特征值u,以便最初没有异常值。在这里,为了简单起见,我们fixu=ur+1,但在集合[ui]i>r+1中的任何其他选择都会做得同样好。然后,根据这个公式,我们可以将C重写为C的一个小阶扰动。实际上,由于每个离群值[ui]i6rare通过假设与整体很好地分离,我们可以用任意I6r的正实数di对每个峰值uib进行参数化,如下所示:ui=u(1+di)≡ ur+1(1+di),di>0,i 6 r.(3.54),因此,总体协方差矩阵C由以下公式给出:C=NXi=1uiviv*i、 式中,如果i 6 ruiif i>r+1,则ui=(u(1+di)。(3.55)更综合地说,可以将C写成:C=CIN+V(r)DV(r)*, (3.56),其中V(r)…=【v,…,vr】∈ RN×rand D…=diag(d,…,dr)是表征尖峰的对角矩阵。我们还将有效无峰样本协方差矩阵定义为E=C1/2XX*C1/2,用S=X表示*CX T×T“对偶”矩阵。如【38】所述,可以通过E的统计来研究E的异常值统计。为了简单起见,让我们考虑秩一r=1的情况(一般情况见【38】。那么,我们有了- E) =det(zIN- 十、*C(英寸+dvv*)十) =det(zIN- XX号*C(英寸+dvv*)).可转换为:det(zIN- E) =det(zIN- E) det(英寸- d(锌- E)-1vv*E) (3.57)我们可以得出结论,当且仅当第二行列式消失,即如果d(λin- E)-1vv*E的特征值等于1。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:55:33
为了找到λ,我们注意到第二个行列式只是一个秩一更新,这意味着它只有一个由方程d给出的非平凡特征值λhv,GE(λ)vi-1.= 1,(3.58),其中GEI是E的预解式。(3.58)的困难部分是找到标量积hv,GEvi的(渐近)表达式。让我们假设C是高斯分布,这允许我们任意设置v=(1,0,…,0),而不损失一般性。那么我们要解的方程是:λGE(λ)=d-1+ 1. (3.59)正如我们将在下一节中看到的,GEA的条目实际上收敛到N的确定数量→ ∞ 使用公式(4.6)得出(另一种推导见(C.19))。结果(z)≈z-u(1 -q+qzgE(z))=z(1- ur+1gS(z)),其中我们使用了标识(3.33)和该u≡ ur+1,在最后一步中构造(3.56)。如果λ不是E的特征值,我们发现等式(3.59)在LDL1中变为-ur+1gS(λ)=d-1+1,(3.60),相当于:gS(λ)=ur+1(1+d)≡u,(3.61),其中我们在最后一步中使用了(3.54)。因此,如果λ满足大N,我们可以看到λ是一个异常值:λ=θ(u)…=学士学位u, (3.62)该结果非常普遍,可以推广到任何离群值λi和i∈ [[1,r]]。此外,我们可以看到N→ ∞, (随机)异常值λ收敛到u的确定函数。因此,函数(3.62)描述了异常值所处的“经典位置”,因此可以解释为异常值(3.40)的模拟值。然而,请注意(3.62)要求了解无刺基质S(或E)。在实践中,我们应该做出一些假设,以决定是否应将agiven经验特征值视为尖峰。结果(3.62)推广了Baik-Ben-Arous-P'ech'e对尖峰协方差矩阵模型的结果【118】。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:55:38
事实上,让我们假设真协方差矩阵C的特征值是由非高斯项组成的。可以使用标准比较技术对非高斯项进行扩展,详情参见[111]。一个异常值和N- 1单位特征值。然后,我们可以简单地推断出,对于alli=1,…,ui=1,N这意味着E的光谱受Marˇcentko Pastur定律(2.42)管辖。事实上,在极限N→ ∞, E和E的频谱是等效的,因为扰动是有限秩的。因此,我们可以很容易地计算对偶矩阵S从(3.35)到fIndbs(x)=x+q1的蓝色变换-x、 (3.63)将该公式应用于方程(3.62),然后导致所谓的BBP相变(λ=u+qu-1如果u>1+√qλ= λ+= (1 +√q) 如果u6 1+√q、 (3.64),其中u=u(1+d)是C的最大特征值,假设为尖峰。注意,在极限u内→ ∞, 我们得到λ≈ u+q+O(u-1). 对于秩r扰动,所有特征值使得uk>1+√q、 1 6 k 6 r最终将在马ˇ岑科Pastur海上方隔离,其他所有在λ+以下消失。所有这些孤立特征值都具有T阶高斯函数-1/2[118]. T阶的典型函数-1/2也适用于任意C[38],并且比大部分分布的不确定性小得多√q、 注意,将公式(3.9)简单应用于异常值会导致顶部特征值周围出现“迷你Wishart”分布,这是不正确的(分布为高斯分布),除非顶部特征值的简并度与N.4成正比。在前一章中,我们看到了特征向量的统计信息,RMT的工具允许我们推断E的(渐近)谱的许多性质,无论是对于谱的整体还是更局部化的区域(边缘和离群值)。这些结果使我们能够非常详细地描述大样本协方差矩阵特征值的统计特性。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:55:41
特别是,很明显,在高维极限下,不推荐使用样本协方差矩阵,因为每个样本特征值[λi]i∈[[N]]收敛到非确定性值,但该值与相应的“真实”总体特征值【ui】i不同∈[[N]]。请注意,上述结果仅涵盖了关于该主题的大量文献中的一小部分,包括研究微观/局部统计(下至N-1刻度)[95、96、111、121]。另一方面,关于特征向量的结果相对较少。一个原因是,RMT中的大多数研究都集中在旋转不变的集合上,因此特征向量的统计特性在定义上是无特征的。尽管如此,这个问题对于样本协方差矩阵非常重要,因为在这种情况下,“总体”矩阵的特征向量的方向必须以某种方式留下痕迹。关于样本矩阵E的特征向量,至少有两个自然的问题:(i)样本特征向量有多相似∈还有真正的我∈[[N]]?(ii)通过观察两个独立的实现(例如E),我们可以了解关于总体协方差矩阵的哪些信息=√CW公司√C和E=√CW公司√C–通过C保持相关?本章的目的是介绍一些关于大样本协方差矩阵特征向量的最新结果,这将使我们能够回答这两个问题。更准确地说,我们将展示第2节中开发的工具如何帮助我们提取特征向量的统计特征∈[[1,N]]。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:55:44
请注意,我们将讨论乘法噪声模型的这些问题(见上文(2.80)),但对于加法噪声也可以研究相同的问题,见[39、111、122、123、124]和附录D。表征两个任意向量(如ξ和ζ)之间相似性的自然量是考虑ξ和ζ的标量积。更正式地说,我们将“重叠”定义为hξ,ζi。由于实对称矩阵的特征向量仅定义为一个符号,因此我们实际上应考虑平方重叠hξ,ζi。在上面提到的第一个问题中,我们想了解总体矩阵的特征向量之间的关系∈[[N]]和样本矩阵的那些[ui]i∈[[N]]。平方重叠矩阵定义为hui,vji,它形成所谓的双随机矩阵(行和列上的和都等于单位的正元素)。为了研究这些重叠,本章的中心工具将是预解式(而不是前一节中的归一化跟踪)。事实上,如果我们选择v作为参考基础,我们会从(2.6)中发现:hv,GE(z)vi=NXi=1hv,uiiz-λi,(4.1)对于v,为RNof单位范数中的确定性向量。注意,我们可以将形式主义扩展到更一般的GE(z)条目,形式为:hv,GE(z)vi=NXi=1hv,uiihui,即-λi,(4.2)对于v和vtwo单位范数确定性向量,单位为RN。我们从方程中看到。(4.1)和(4.2)预解式的每个极点定义了对应样本特征向量上的投影。这表明我们需要应用的技术与上面用来研究态密度的技术非常相似。然而,我们应该立即强调,与特征值相反,任何给定i的每个特征向量ui在→ ∞,永远不会达到确定的极限。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:55:47
因此,我们需要引入一些平均程序,以获得明确的结果。因此,我们将考虑以下数量,Φ(λi,uj)…=NE【hui,vji】,(4.3)其中,期望E可以被解释为随机性不同实现的平均值,或者,对于应用而言,更具意义的是,可以被解释为我们在1范围内选择的宽度为dλ=η的特征值的固定样本过小区间的平均值 η  N-1(假设η=N-1/2)使得区间dλ中有许多特征值,同时保持dλ足够小,以使光谱密度保持恒定。有趣的是,对于大型矩阵,这两个过程会产生相同的结果,即局部“平滑”量Φ(λ,u)是自平均的。我们强调,在本节中,我们认为总体特征向量是确定性的。只有样本特征向量是随机的。还应注意上述定义中的系数N,表示我们预计典型的方形重叠为1/N级,见下文。对于第二个问题,主要的关注量类似地是,两个独立的噪声特征向量Φ(λi,λj)之间的(均方)重叠=NE【hui,▄uji】,(4.4)式中[▄λi]i∈[[N]]和[~ui]i∈[[N]]是▄E的特征值和特征向量,即独立于E的另一个样本矩阵(但具有相同的基本总体矩阵C)。在介绍结束时,我们简短地评论了一些模糊的定义(4.3)和(4.4)。如上所述,我们通过特征值对特征向量进行索引,这允许我们考虑(4.3)的连续极限。然而,更精确的定义应该是Φ(λ,u)…=EN-1PNi,j=1hui,~bjiδ(λ-λi)δ(u-ui)但我们保留了符号(4.3),但有一点滥用符号,因为在离群值或大特征值之间分离分析会更方便。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:55:51
我们强调,这句话也适用于重叠(4.4)。4.1. 存在噪声时的渐近特征向量变形。在本节中,我们考虑第一个问题,即:我们能否描述噪声对特征向量的影响?不同的是,样本特征向量如何偏离总体特征向量?为了回答这个问题,等式(4.3)似乎是一个很好的起点,因为它允许我们准确地提取样本特征向量到总体特征向量的投影。现在,我们将证明等式(4.3)在大N极限下收敛到确定性量;更准确地说,我们可以将本节的主要结果总结如下:(i)任何体样本特征向量在总体基础上是非定域的,即Φ(λi,uj)~ O(1)(而非O(N)),对于任何i∈ [[r+1,N]]和j∈ [[N]];(ii)对于任何异常值(即i 6 r),Ui集中在一个圆锥体内,其轴平行于vi,但在与尖峰方向vi正交的任何方向上完全离域。回想一下,我们已经通过其相关特征值索引了特征向量。因此,从推理的角度来看,这些结果看起来相当令人失望。实际上,对于体特征向量,我们发现,对于大N,投影估计的特征向量及其相应的“真”方向几乎肯定收敛到零;i、 e.样本特征向量似乎包含很少关于真实特征向量的信息(在这一点上,请参见[40])。尽管如此,正如我们将在下面看到的,平方重叠并不都等于1/N,但出现了一些有趣的调制,我们在下面通过将Marˇcenko Pastur方程扩展到完全预解式来计算这些调制。另一方面,对于异常值而言,全球情况则截然不同。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:55:56
特别是,上文第3节中提到的相位转换现象也适用于样本峰值特征向量到其母体峰值的投影:一旦特征值从整体中弹出,正方形重叠就变成1阶,如[35、39、125]中所述。事实上,可以精确计算样本尖峰特征向量与父尖峰之间的角度,见下文。4.1.1. 大宗商品。让我们首先关注整体特征向量,即当经验相关矩阵的维数增长到整数时,与光谱密度的整体特征值相关的特征向量。这个问题最近在[36,37]中进行了研究,我们在此重复不同的论点。第一步是描述样本协方差矩阵预解的渐近行为。这可以通过将自由矩阵乘积的预解式(2.100)专门化为A=C和B=XX的情况来实现*. 换句话说,A是人口矩阵,而B是白Wishart矩阵,扮演着噪声乘法扰动的角色。使用(2.44),我们明确地知道white-Wishart矩阵的S变换,因此,对于N→ ∞:zGE(z)ij=z(z)GC(z(z))ij,z=z1-q+qzgE(z)。(4.5)在文献中,这种极限结果被称为“确定性等价物”,因为RHS仅取决于确定性量,这是大型随机矩阵自平均特性的另一个证据。应该注意到(4.5)是预解矩阵之间的关系,它推广了scalarMarˇcenko Pastur方程(3.9)(可以通过在方程两侧取轨迹来恢复)。该关系首次出现在【66】中,使用高斯输入有效的平面图展开获得。几年后,这一结果在Ref。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:55:59
[111]在一个更一般的框架中,再次强调了随机矩阵预解的普遍性,直至局部尺度。选择在C为对角线的基础上工作,等式(4.5)减少为:GE(z)ij=δijz-ui(1-q+qzgE(z))。(4.6)该确定性等效物适用于N阶函数-1/2. 这可以从中心极限定理(CLT)中推断出来(见附录C)。非常有趣的是,在[111]中提供了错误项的显式上界。特别是,作者表明,式(4.5)保持了局部尺度η=bηN-1带bη 1,误差项以:ψ(z)为界=sqIm gS(z)bη+qbη,(4.7)回想一下,gE(z)是极限Stieltjes变换。注意,在第2.0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5λ节中提出的复制方法中,也不需要高斯假设-0.50.00.51.01.52.02.5Im[GE(z)](a)Im[GE(z)]的对角线输入,i=1000.0.0 0 0.5 1.0 1.5 2.0 2.5 3.0 3.5λ-0.4-0.3-0.2-0.10.00.10.20.30.4Im[GE(z)](b)i=999和j=1001.0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5λ的Im[GE(z)]的对角线入口-3.5-3-2.5-2-1.5-1-0.50.00.51.0Re[GE(z)](c)Re[GE(z)]的对角线输入,i=1000.0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5λ-0.3-0.2-0.10.00.10.20.3Re[GE(z)](d)为Re[GE(z)]的对角线输入,i=999,j=1001。图4.1:。公式(4.6)的图解。总体矩阵是参数k=5的逆Wishart矩阵,样本协方差矩阵是使用T=2N和n=2000的Wishart分布生成的。对于任何z=λi,计算GE(z)(蓝线)的经验估计值-在里面-1/2带i∈ [[1,N]]来自一个样本,理论值(红线)由公式(4.5)的RHS给出。绿色虚线对应于置信区间,其公式由公式(4.7)给出。只要N足够大。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:56:02
我们在图4.1中给出了这种遍历行为的一个例子,我们看到这种一致性非常好。如何使用(4.5)计算均方重叠?其思想是为完全预解式推导一个类似于(2.11)的反演公式。更具体地说,对于给定的nv=vjan,我们从(2.6)开始,注意真正的特征向量是确定性的。因此,如果z不在E的谱的支持范围内,则后一个方程RHS上的和预计将收敛于大的N极限。此外,整体中的本征值收敛到其经典位置(3.40),因此我们得到→ ∞ thathvj,GE(z)vji~N↑∞ZΦ(λ,uj)ρE(λ)λi- λ - iηdλ。(4.8)其中我们设置了z=λi- iη,η N-1和Φ(λ,uj)是平滑的平方重叠,在λ周围的一小段宽度η上平均。因此,使用Sokhotski-Plemelj恒等式得出最终反演公式:Φ(λi,uj)=πρE(λi)limη→0+Imhvj,GE(λi- iη)vji,(4.9),其中λilies在大部分光谱中的假设在此至关重要。最后一个恒等式允许我们从完整预解式GE计算出整体中任何i(i>r+1)和固定j的平方重叠Φ(λi,uj)∈ [[1,N]]。专注于等式(4.6)中给出的GE(z)的显式形式,我们最终获得了(重新缩放)平均平方重叠的一个漂亮的显式结果:Φ(λi,uj)=qujλi(uj(1-q)- λi+qujλihE(λi))+qujλiπρE(λi),(4.10)带i∈ [[r+1,N]],j∈ [[1,N]]和hE(λi)表示Stieltjes变换gE的实部(见等式(2.9))。这个关系在极限N中是精确的→ ∞ 由Ledoit和P'ech'ein首先推导得出【36】。我们再次强调,即使ujis是异常值,此表达式仍然正确。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:56:11
由于Φ(λi,uj)在q>0时为一阶单位,我们得出结论,E的任何体特征向量uif和特征向量vjof C之间的点积为N阶-1/2,即在大N时消失,因此非离群样本特征向量保留的关于其对应的真实特征向量的信息非常少。这意味着,在高维区域,任何体特征向量都是对真实特征向量的极差估计。我们在图4.2中提供了公式(4.10)的图解,其中n=500,C是κ=1的逆Wishart矩阵。经验平均值来自E的500个独立实现,我们看到它与渐近理论预测(公式(4.10))完全一致。注意,在极限q中→ 0,Φ(λi,uj)在λi附近变得越来越高≈ uj,振幅在q=0时发散。事实上,在这种有限的情况下,我们应该发现ui→ ±vjδij,即样本特征向量等于总体特征向量。4.1.2. 异常值。通过构造,第3.3节的尖峰相关模型使得顶部ReigenValue[λi]i∈[[1,r]]位于ρE的频谱之外。关于相关尖峰特征向量的统计信息,可以说些什么∈[[1,r]]?如果我们将这些异常值视为(实际的)无尖峰矩阵E的有限秩变形,那么通过Weyl的特征值交错不等式[126],共扼密度ρEis不受非宏观尖峰的影响,即对于任何异常特征值,ρE(λi)=0。我们在上一节中看到,对于非离群特征向量,计算重叠的主要成分是(i)自平均特性和(ii)反演公式(4.9)。两者都隐式地依赖于连续极限的有效性,但对于异常值来说,情况并非如此。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:56:15
因此,我们预计离群特征向量的统计数据与大量特征向量完全不同,正如在[125,92]中针对零假设情况C=所证实的那样。在这一节中,我们介绍了分析工具,以分析无轨总体协方差情况下的离群值重叠,如下所示。从等式(3.62)中,我们可以看到每个离群值特征值[λi]i∈E的[[1,r]]收敛到确定性极限θ(ui),其中uiis是相应的总体尖峰,θ是与马ˋ岑科-Pastur方程相关的某个函数。因此,对于孤立的尖峰i∈ [[1,r]]我们可以定义闭合圆盘图4.2。重标均方重叠Φ(λi,uj)作为λi的函数。我们选择C作为参数κ=1.0的逆切分矩阵,并设置N=500,q=0.5。经验平均值(红点)来自E的500个独立实现。理论预测(蓝线)由公式(4.10)给出。均方重叠的峰值在λi附近≈ uj≈ dI在复平面中,以θ(ui)为中心,选择半径,使每个点不包围集合[θ(uj)]j中的其他点∈[[1,r]](详见[38])。然后,定义Γ为闭盘Di的边界,我们可以使用Cauchy积分公式Hui,vji=2πiIΓihvj,GE(z)vjidz,(4.11)对于i,j获得离群特征向量的平方重叠∈ [[1,r]]。我们强调式(4.11)中没有期望值(与式(4.3)中重叠的定义相比)。积分的计算是非常不平凡的,因为对于任何j,GEis在θ(uj)附近都是奇异的∈ [[1,r]]和fine N.为了绕过这个问题,我们重新考虑了(3.56)中定义的无尖峰总体协方差矩阵C和相应的无尖峰样本协方差矩阵E。显然,通过构造,预解GEI在θ(uj)附近不再是奇异的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:56:18
此外,如上所述,E和E的特征值的全局统计在极限N中是相同的→ ∞. 最后,我们可以使用Schur补码公式将Geo的任何投影与异常人口协方差特征基联系起来(请参见附录B):V(r)*GE(z)V(r)=-zD-1.-√IN+DDD-1英寸以上- zV(r)*GEV(r)-1.√IN+DD. (4.12)这一身份已被用于处理相关问题的几项研究【97,38】和其中的参考文献。其推导只需要线性代数参数,可在第4.1.3节中找到。有了这个恒等式,E的异常值的统计数据被视为仅依赖于无尖峰矩阵E。特别是,(4.11)的被积函数可以使用无尖峰预解式重写,该预解式在E的谱之外的任何地方都是解析的。由于E的预解式的全局律在大N限内与E相同,我们可以再次使用估计值(4.5)。通过将(4.5)插入(4.12),获得一个水,vji=-2πiIθ(Γi)z“dj-1+djdjd-1j+1- zhvj,GE(z)vji#dz。(4.13)然后,使用公式(3.58)和柯西定理,最终得出【38】hui,vji=δijuiθ(ui)θ(ui)+O(N-1/2)=δijuiθ(ui)λi+O(N-1/2),(4.14)对于任何i,j∈ [[1,r]]在最后一步中,我们在分母中使用了(3.62)。因此,我们得出结论,样本离群特征向量Ui集中在孔径为2 arccos(uiθ(ui)/θ(ui))的Vi周围的圆锥体上。我们还从式(4.14)中推断,UIs在所有方向上都是离域的,与不同的峰值μj6=ui相关。式(4.14)的一个有趣应用是重新考虑上一章中介绍的峰值协方差矩阵模型。为了简单起见,我们假设一个峰值(r=1),从方程(3.63)可以得到,对于u>1+√qθ(u)=u+q+qu- 1,并将该结果代入方程(4.14)yieldshu,vi=uθ(u)1.-q(u- 1)+ O(T-1/2),(4.15),这是预期结果[35、39、97、112、40]。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:56:21
这一结果表明,当μ→ 1 +√q,因为它应该来自结果(3.64)。同样的分析也适用于样本峰值和总体特征值j>r之间的重叠。详情见【38】,最终结果为Φ(λi,uj)=qujλi(1-uj/ui),i∈ [[1,r]],j∈ [[r+1,N]]。(4.16)正如预期的那样,任何异常特征向量uihas~ N-1/2与Ce的任何特征向量重叠,除了其来自vi的“父”之外。在r=1的情况下,我们将图4.3中的等式(4.16)作为i>2的总体特征值ui的函数进行说明:在我们的示例中,C是参数κ=1的逆Wishart矩阵,我们添加了秩1扰动,使得λ≈ 10、经验平均值来自E的200次实现,我们发现与理论预测的一致性不太好。4.1.3. 身份的推导(4.12)。恒等式(4.12)的推导是处理样本协方差矩阵E异常值的核心工具。它完全依赖于线性代数参数(请参见附录B以获取提示)。为了减轻符号的重量,让我们重命名V≡ 本节中的V(r)。第一步是从等式(3.56)中写出以下等式:pC C-1件- IN=(IN+VDV*)-1.- 英寸=-(英寸+VDV*)-1VDV*= -VD(Ir+D)-1伏*(4.17)图4.3。重标均方重叠Φ(λ,uj)作为j>1时uj的函数。我们选择无尖峰填充矩阵C为反向Wishart矩阵,参数κ=1.0,N=500。我们加上一个扰动,使得λ≈ 10与其他隔离。样本矩阵E由q=0.5的aWishart矩阵给出。我们比较了来自E的200个独立化的经验平均值(蓝点)。理论预测(红线)由公式(4.16)给出。我们在第二行中使用了预解式标识(4.32)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:56:24
这允许我们得到(忽略参数z)C-1/2C1/2GEC1/2C-1/2=C-1/2zC公司-1.- XX号*-1C级-1/2=z(C1/2C-1C1/2- IN)+zIN- E-1=-zVD(I+D)-1伏*+ G-1E级-1,(4.18),其中我们在最后一步中调用了前面的等式(4.17)。从(B.8)开始,我们有一个≡吉恩- E、 B类≡ -zV,D≡ D(Ir+D)-1和C≡ 五、*:C-1/2C1/2GEC1/2C-1/2=GE+zGEVD-1+Ir- 零电压*GEV公司-1伏*通用电气。(4.19)从那里,一个有(IN+D)1/2V*GEV(英寸+直径)1/2=V*GEV+zV*GEV公司D-1+Ir- 五、*GEV公司-1伏*GEV。(4.20)然后我们使用标识a- A(A+B)-1A=B- B(A+B)-1B,(4.21),A=V*GEV和B=-(D)-1+Ir)/z获得(Ir+D)1/2V*GEV(Ir+D)1/2=-z“Ir+DD+Ir+DD-(D)-1+红外)+零电压*GEV公司-1Ir+DD#。(4.22)通过重新安排条款,我们最终获得*GEV=-z“D-1.-√Ir+DDD-1+Ir- 零电压*GEV公司-1.√Ir+DD#,(4.23),精确地等于(4.12)。4.2. 相关样本协方差矩阵的特征向量之间的重叠。我们现在考虑本章的第二个问题,也就是说,我们可以从样本特征向量中了解多少关于C结构的信息?不同的是,假设一个人测量同一过程的样本协方差矩阵,但在两个独立的时间间隔上,对应的特征向量预计有多接近?为了回答这个问题,让我们用E和E表示相同人口矩阵C定义的独立样本估计=√CW公司√C、 E=√CW√C、 (4.24)其中,W和▄W是两个独立的white Wishart矩阵,分别具有参数q和q。如第4.1节所述,我们可以通过均方重叠来研究这个问题。在本节中,我们为高维区域中的这些重叠提供了精确、明确的公式,也许令人惊讶的是,我们将看到,在没有任何关于C谱的先验知识的情况下,可以对它们进行评估。更具体地说,我们将显示等式(4.4)在大N极限下再次表现出自平均行为,即独立于e和e的实现。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:56:29
此外,我们将看到,重叠(4.4)明显偏离了平凡的零假设,因为种群C具有非平凡的结构。因此,这表明我们可能仅使用经验量就可以推断非常大的数据库的相关结构。所有这些结果都是在最近的工作中获得的,我们在此仅给出主要步骤。为清楚起见,我们使用符号▄λ>▄λ>…>~λNto表示▄E的特征值,由▄u,▄u,解相关特征向量。注意,为了方便起见,我们将再次使用相应的特征值对特征向量进行索引。本节的中心工具是(4.4)的反演公式,这通常在RMT中完成。为此,我们定义了二元复函数ψ(z,~z)=*NTrh(z-E)-1(yenz-E)-1i+P,(4.25),其中z,~z∈ C和h·Ip表示与EAN和▄E相关的概率测度的平均值。然后,通过E和▄E的谱分解,可以得到ψ(z,▄z)=*NNXi,j=1z-λiz-§λjhui,§uji+P,(4.26),其中P表示E和▄E的噪声部分的概率密度函数。对于大型随机矩阵,我们期望特征值为λi∈[[1,N]]和[∧i]i∈[[1,N]]坚持其经典位置,即相对于光谱密度的分位数进行平滑分配(见第3.2.1节),以便样本特征值在大N限值下具有确定性。因此,我们在取连续极限ψ(z,~z)后得到~Z Zρ(λ)Z-λИρ(∧)~z-§λΦ(λ,§λ)dλdλ,(4.27),其中ρ和ρ分别是E和▄E的光谱密度,Φ表示上述(4.4)中定义的均方值。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:56:33
然后,需要计算ψ(x-iη,y±iη)~Z Z(x-λ+iη)(x-λ) +η(y-~λ iη)(y-§λ)+ηρ(λ)~ρ(~λ)Φ(λ,~λ)dλd~λ(4.28),从中可以推断出ψ(x)-iη,y+iη)- ψ(x)- iη,y- iη)~ 2Z Zηρ(λ)(x-λ) +ηη|ρ(|λ)(y-Иλ)+ηΦ(λ,キλ)dλdキλ。(4.29)最后,反演公式遵循Sokhotski-Plemelj恒等式η→0+Reψ(x)-iη,y+iη)- ψ(x)- iη,y- iη)~ 2πρ(x)~ρ(y)Φ(x,y)。(4.30)注意,只要其光谱密度收敛到一个明确的确定极限,该推导适用于任何E和▄E模型。反演公式(4.30)允许我们通过二元函数ψ(z,~z)的渐近行为来研究均方重叠(4.4)。此外,由于我们能够控制E和▄E的预解式(见等式(4.5)),等式(4.25)的计算是即时的,并导致ψ(z,▄z)~z▄zNTrZ(Z)(Z(Z)-C)-1▄Z(▄Z)(▄Z(▄Z)- C)-1., (4.31)其中Z(Z)在(4.5)中定义,Z(Z)通过替换q和gEby@q和g@E从Z中获得。然后,我们使用恒等式Z(Z)-C-1.~Z(~Z)- C-1=▄Z(▄Z)- Z(Z)hZ(Z)-C-1.-~Z(~Z)- C-1i(4.32)获得ψ(z,~z)~Z(Z)~Z(~Z)Z~Z~Z(~Z)- Z(Z)NTrhZ(Z)-C-1.-~Z(~Z)- C-1i。(4.33)从最后一个方程,并使用Marˇcentko Pastur方程(3.9),我们最终得出ψ(z,~z)~~Z(~Z)- Z(Z)“~Z(~Z)~zgE(Z)-Z(Z)zg▄E(▄Z)#。(4.34)人们注意到,公式(4.34)仅取决于先验可观测量,即它们不明确涉及未知矩阵C。一旦我们描述了二元函数ψ(z,~z)的渐近行为,我们就可以应用反演公式公式(4.30),以检索均方重叠(4.4)。在说明本节的主要结果之前,我们首先将(4.34)改写为T×T对偶矩阵S=T的Stieltjes变换gsa的函数-1台*满足XX的CX*= W和等式(3.33)。同样,我们定义S=T-1X*C▄X带▄X▄X*=W。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群