全部版块 我的主页
论坛 经济学人 二区 外文文献专区
2022-6-15 15:56:37
使用(3.33)并省略参数z和▄z,我们可以将(4.34)重写为ψ(z,▄z)~q▄qz▄z“(▄qz- qz)gSgS- gS+(q- q)g  SgS- g▄S▄+gS+g▄Sq▄z-1.-qqzz.(4.35)我们从(4.30)中看到,现在需要考虑极限η→ 0+以获得所需的结果。为了使符号更清晰,让我们定义(λ)≡ limη→0+gS(λ-iη)=mR(λ)+imI(λ)(4.36),其中mR(λ)=qhE(λ)+1-qλ,mI(λ)=qρE(λ)+(1- q) δ,(4.37),其中是ρE的希尔伯特变换。请注意,该关系式源自等式(3.9)。我们还定义了▄m(λ)=limη→0g?S(λ-iη),并分别用实部和虚部表示。然后,方程(4.4)对于任何λ的渐近行为∈ 供应%和∧∈ %由Φq,q(λ,λ)=2(qλ)给出(详细推导见[124])- q▄λ)mR | m|- mR | m|+ (q-q)|~m|- |m级|λИλh(mR- mR)+(mI+▄mI)ih(mR- mR)+(mI- mI)i.(4.38)一个有趣的一致性检查是当▄q=0时,在这种情况下,样本特征值与颚化矩阵的真特征值一致,即▄λ→ u. 在这种情况下,我们回到上一节的框架,即获得e和C的特征向量之间的重叠。可以很容易地检查▄mR=1/u和▄mI=0。因此,我们从(4.38)中推断出Φq,~q=0(λ,u)=qλu(mR- 1/u)+mI=quλ| 1-um(λ)|,(4.39),这是在限制η中应用公式(3.33)后写入(4.10)的另一种方式→ 0+. 因此,结果(4.38)推广了公式(4.10),因为我们能够研究两个可能有噪声的样本估计之间的均方重叠。请注意,在q=q的情况下,等式(4.38)可以稍微简化为:Φ(λ,~λ)=q(λ-~λ)mR(λ)| m(∧λ)|- mR(∧)m(λ)|λИλh(mR- mR)+(mI+▄mI)ih(mR- mR)+(mI- mI)i,(4.40),当∧=λ[124],Φ(λ,λ)=q2λ| m(λ)时变为|λmR(λ)/| m(λ)|mI(λ)|λm(λ)|。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:56:40
(4.41)最后的“自重叠”结果量化了与相同特征值λ相关的特征向量Ui和Ua的稳定性,当它们都来自相同的总体矩阵C时。该预测重叠和经验结果之间的任何统计显著偏差都可以解释为对假设的否定,即“真实”总体矩阵对应于E和▄E实际上是不同的。从应用程序的角度来看,这是非常有趣的,尤其是对于财务数据,没有任何东西可以确保C与时间无关。既然我们有了所有这些理论结果,现在让我们给出公式(4.40)的一些应用,因为它们将强调我们确实可以从均方重叠(4.4)中找到关于ofC光谱的真实信息。我们强调,以下所有应用程序都是在q=~q的情况下执行的,以便对结果有更多的了解。通常,我们从零假设C=开始,它将作为我们处理更结构化光谱的基准。正如我们在第(2.2.3)节中所示,Stieltjes变换了gE,从而得到了从Marˇcentko Pastur密度得到的gSisexplicit。更准确地说,我们从公式(2.41)和(3.33)中推断出,Gs由Gs(z)=z+q给出- 1.-ip4zq-(z+q-1) 2z(4.42)适用于任何z∈ C-. 使用定义(4.36)很容易看出,我们有mr(λ)=λ+q- 12z,mI(λ)=p4λq-(λ+q-1)2λ. (4.43)因此,得到| m(λ)|=λ-1和| m(λ)|=q/(2λ),并将此表达式插入公式中。(4.41),对于任何λ,我们最终得到Φq,q(λ,λ)=1,(4.44)∈ [(1 -√q) ,(1+√q) 】。这个简单的结果是预期的,因为它对应于C的光谱没有真实结构的情况,所以问题中的所有各向异性都是由噪声引起的,噪声在两个样本中是独立的。图4.4:。N=500且q=q=0.5的NEhui评估。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:56:45
总体矩阵C由带参数κ的逆Wishart给出,样本协方差矩阵S和▄S由多变量高斯分布生成。在200次实现中取经验平均值(蓝点),并对所有[λi]的理论预测公式(4.41)(红线)进行评估。接下来,我们考虑人口相关矩阵C的一个更结构化的示例。可以分析处理的一个方便情况是,当C为逆Wishart矩阵时,即根据公式(2.54)中定义的κ>0(2.58)进行分布。正如我们在前一章中所看到的,在这种情况下,Stieltjestransform gE(z)是明确的(参见等式(3.41))。回到等式(4.41),我们可以从等式(3.41)得出,mR(λ)=λ(1+qκ)+qκ(1-q) λ(λ+2qκ),mI(λ)=qqλ-λiw-qλiw+- λλ(λ+2qκ),(4.45)带λ∈ [λiw-, λiw+]其中λiw±在(3.42)中定义。将这些表达式插入公式(4.41)中,在进行基本计算后,得出Φq,q(λ,λ)=(1+qκ)(λ+2qκ)2qκ2λ(1+κ(1+q))- λκ + κ(-1+2q(1+qκ)). (4.46)最后一个公式的直接结果是,在存在各向异性相关性的情况下,均方重叠(4.4)明显偏离了零假设Φ(λ,λ)=1。在近似各向同性极限κ中→ ∞, 对应于极限C→ 在中,一个得到[124]Φ(λ,λ)~κ→∞\"1 +(λ -1)(~λ -1) 2qκ+O(κ-2) #,(4.47),这实际上在这个极限下是通用的(即,独立于矩阵C的精确统计特性),前提是C的特征值谱具有(2κ)给出的方差-1.→ 0+[124].在一般情况下,我们在图4.4中提供了最后一个语句的数值说明,其中κ=5,N=500,q=0.5。正如我们所期望的λi≈任意i的λIf∈ [[1,N]],我们将我们的理论结果(4.46)与经验平均值[hui,~uii]进行了比较,得出了超过200个E的实现,我们发现这一一致性再次非常好。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:56:48
因此,我们得出结论,(4.38)的一个可能应用是仅使用样本特征向量直接估计C的统计纹理:有关有趣的示例,请参见第7节。现在,我们使用第4.1节的结果,给出Φq的另一种推导方法。以下参数非常普遍,在考虑更一般的随机矩阵的IGenvector之间的重叠时可能有用。起点是trueeigenbasis的正交性,即VV*= 信息V..=[v,…,vN]。因此,我们可以始终编写ui,~uji=*ui,NXk=1vkv*k~uj+=NXk=1hui,vkihvk,~uji(4.48)使用第4.1节的结果,我们重命名重叠hui,vki=pΦq(λi,uk)/N×ε(λi,uk),其中Φq(λ,u)在(4.3)中定义,ε(λ,u)是单位方差的随机变量。因此,我们有hui,~uji=NNXk=1qΦq(λi,uk)Φq(~λj,uk)ε(λi,uk)ε(~λj,uk)。(4.49)如【124】中所述,通过对噪声进行平均并作出“遍历假设”【127】——根据该假设,所有符号ε(u,λ)实际上在大N极限中彼此独立——一个端点SUP,具有以下相当直观的平方重叠卷积结果:Φq,q(λi,λj)=NNXk=1Φq(λi,uk)ΦИq(λj,uk)(4.50)如果将重叠函数Φ替换为(4.10),则该表达式是完全通用的,并且与等式(4.40)完全等价。然而,尽管该表达式仍然包含对纯矩阵C结构的明确依赖,但它在等式(4.40)中已完全消失。公式(4.50)的一个有趣应用是,当E(和E)的谱包含一定数量的异常值时。使用LDL中的结果(4.14)和(4.16)以及i 6 r中的产量:Φq,~q(λi,~λi)≈ uθ(u)~θ(u)θ(u)~θ(u),(4.51),其中我们记得函数θ在(3.62)中定义,我们通过将qq替换为qq来定义θ。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:56:51
注意,通过注意u=gS(λ),θ(u),我们可以用可观测变量表示(4.51)=-1gS(θ(u))ui,(4.52),我们将其插入(4.51)中,得出Φq,¢q(λ,¢λ)≈gS(λ)λgS(λ)gS(λ)λgS(λ)。(4.53)当q=~q时,该表达式变得更简单,因为它变成了Φq,q(λ,~λ)≈gS(λ)λgS(λ)!。(4.54)从(4.14)和(4.16)中进一步推断,对于i 6 r,Φq,¢q(λi,¢λj)~ O(N-1) 对于任何j 6=i.5。贝叶斯随机矩阵理论我们在前几章中看到,RMT允许人们对大型经验协方差矩阵做出精确的陈述。特别是,我们强调,当q=O(1)时,样本谱密度ρE显著偏离真实谱,因此经典样本估计量E在高维极限下不一致。文献中曾多次尝试使用启发式或决策论论据纠正这种“维度诅咒”(这些尝试的总结见第7.2节)。尽管这些方法存在很大差异,但所有这些方法都属于所谓的收缩估计器,也就是说,人们寻求“清理”样本特征值的最佳方法,以使估计器对测量噪声尽可能鲁棒。在前一章中,我们坚持认为体样本特征向量是非定域的,具有N阶投影-1/2在所有方向上,这意味着它们是总体特征向量的噪声极大的估计量。因此,将样本特征值替换为通过反转Marˇcenko Pastur方程得到的估计真实值的天真想法不一定会带来令人满意的结果——只有在我们对C的特征向量有充分了解的情况下,这才是最佳策略。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:56:57
因此,留给我们的是一个非常复杂的问题:在知道特征值有系统偏差且特征向量几乎完全未知的情况下,我们如何“准确”估计高维区域中的矩阵C?本章和下一章的目的是通过制定与质量比q一致的非最优策略来估计C来回答这个问题。所谓最优,我们的意思是,我们要构建的估计器必须最小化给定的损失函数。自然最优性标准是估值器(此后称为Ξ(E))与真矩阵C之间的平方距离。至于James Stein估值器,我们期望“混合”估值器在高维上比“经典”估值器(如Pearson估值器)提供更好的性能。在这方面,我们引入了贝叶斯框架,粗略地说,它允许我们引入概率模型,通过先验信念的概念对可用数据进行编码。概率表示置信度的事实是贝叶斯推理的核心。正如本综述导言所述,这一理论取得了很大的成功,尤其是在高维框架中。这一理论的核心工具是众所周知的贝叶斯公式,它允许我们引入条件概率的概念。有许多不同的方法可以使用这个公式,相应的思想流派被称为经验、主观或客观贝叶斯(参见示例[128])。在这里,我们将不讨论这些不同的观点,而是将重点放在问题的推理部分。更准确地说,我们在本章中的目标是为Ξ(E)构造一个贝叶斯估计。因此,我们将本章组织如下。在第一部分中,我们回顾了贝叶斯推断的一些基本结果,并介绍了我们感兴趣的估计量。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:57:00
然后,我们重新考虑公式(1.9)中提到的著名的“线性收缩”估计量,该估计量通过共轭先验的概念在样本估计量和身份矩阵之间进行线性插值。最后,我们考虑了一类旋转不变先验,其中前几章介绍的RMT形式主义被应用于推导C的最优估计量,这将证明比所有过去的尝试更有效–参见第8.5.1章。贝叶斯最优推理:一些基本结果。5.1.1. 后验概率分布和联合概率分布。贝叶斯理论至少在原则上允许我们回答以下问题:给定观测矩阵Y,如果C的统计先验知识可用,我们如何才能最好地估计C?先验信息这一概念一直是许多争议的主题,但却是贝叶斯推理理论的基石。更准确地说,贝叶斯推理的主要概念是众所周知的贝叶斯公式P(C | Y)=P(Y | C)P(C)P(Y)(5.1),其中IP(C | Y)是给定测量值的C的后验概率。IP(Y | C)是似然函数,对测量过程进行建模。IP(C)称为C的先验概率,即对C的先验信念(或知识)。IP(Y)是边际分布,有时被称为证据。注意,边缘分布通常被认为是一个简单的归一化常数(或配分函数),因为它由P(Y)=ZDCP(C)P(Y | C)给出。(5.2)此外,我们将经常使用由P(C,Y)=P(Y | C)P(C)定义的联合概率分布的概念。(5.3)因此,贝叶斯模型中的两个关键输入是似然过程和先验分布。使用贝叶斯框架学习实际上可以分为两个不同的步骤,在我们的上下文中是:1。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:57:03
将联合概率分布P(C,Y)定义为先验分布与似然函数的乘积,即P(C,Y)=P(Y | C)P(C)。(5.4)2. 在可用数据上测试后验分布P(C | Y)的一致性。我们强调,先验分布的存在并不意味着C是随机的,它简单地表示了对C结构的信任程度。采用这种观点的主要优点是便于解释统计结果。例如,贝叶斯(概率)区间告诉我们试图估计的参数值的概率有多大。这与频率间隔形成对比,频率间隔仅根据一系列相似的实现(置信区间)来定义。我们将在下一段讨论这些观点之间的差异。5.1.2. 贝叶斯推理。贝叶斯推理的概念与所谓的贝叶斯风险的概念有关。在我们的问题中,我们想要估计给定样本数据Y的真实协方差矩阵C;我们将用Ξ(Y)表示这个估计量。有两种方法来思考这个问题:频繁者和贝叶斯方法。我们将在本节中详细说明这两者之间的差异。让我们引入一个损失函数L(C,Ξ(Y)),该函数量化了估计量与真实量C之间的距离。通常,假设该损失函数是一个L(C,C)=0的非负凸函数。传统的频率分析方法是通过对不同观测集上的损失函数求平均来评估给定激励因子的性能,对于固定的C。另一种观点是认为C的精确性质未知。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:57:06
这种观点的变化必须被编码到推理问题中,一种方法是查看所有先验可能实现的C的损失函数的平均值,而不是Y本身的实现。这是贝叶斯优化策略,相应的决策规则是所谓的贝叶斯风险函数,定义为:RBayes(L(C,Ξ(Y)))=L(C,Ξ(Y))P(C,Y),(5.5),其中,与频点法不同,期望值取Yand和C的联合概率。最常用的损失函数之一是希尔伯特-施密特(或欧几里德)平方形式,即LL(C,Ξ(Y))=Tr[(C- Ξ(Y))(C- Ξ(Y))*] . (5.6)利用协方差矩阵是对称的,并应用贝叶斯规则,我们可以看到RBAyes=Tr公司(C)-Ξ(Y))P(Y | C)P(C)=Tr公司(C)-Ξ(Y))P(C | Y)P(Y),(5.7),其中我们使用边际分布为正,以便交换第二行中的积分顺序。最优贝叶斯估计量定义如下:让我们用MN(Y)表示N×N正有限矩阵的集合,它们是Y的函数。这定义了c的容许估计量集合。然后,根据最小均方误差(MMSE)条件,即ΞMMSE,给出与损失函数(5.6)相关的Bayes估计量≡ ΞMMSE(Y)…=argminΞ(Y)∈锰(Y)LL(C,Ξ(Y))P(C,Y),(5.8)展开(5.7),很容易看出MMSE估计量由后验平均值给出:ΞMMSE=hCiP(C | Y)。(5.9)注意损失函数的自然选择可能取决于问题的性质。其他损失函数通常会导致不同的Bayes估计量,但我们不研究这种推广。5.2. 设置贝叶斯框架。既然我们已经导出了我们正在寻找的最优估计量,我们仍然需要将联合概率函数P(C,Y)参数化。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:57:11
因此,贝叶斯模型中有两个输入:似然函数和先验分布,我们在本节中重点讨论前一个量。在多变量框架中,最常见的假设(但不一定是最现实的)是测量过程Y是高斯的,也就是说,P(Y | C)=(2π)NTdet(C)Texp-TXt=1NXi,j=1YitC-1i,jYjt. (5.10)很容易看出这是Boltzmann类型,如等式(2.1)所示。更准确地说,使用跟踪操作符的cyclicproperty,一个getsTXt=1NXi,j=1YitC-1ijYjt=TrYC公司-1年*= T Tr欧共体-1..因此,N元高斯似然函数可以写成asP(Y | C)=(2π)NTexp-TTr公司对数(C)+EC-1.≡ P(E | C),(5.11),其中我们对任何方阵A使用雅可比公式det(A)=exp[Tr log A]。因此,我们可以将推理问题重写为样本协方差矩阵E的函数,尤其是MMSE估计量变为ΞMMSE≡ ΞMMSE(E)…=hCiP(C | E)。(5.12)经过一番思考,这种设置与上面第3章和第4章中开发的框架完全一致。事实上,在这些章节中,我们研究了样本协方差矩阵E的光谱特性,给出了C的极限光谱分布(第3.2.1节中介绍的所谓“直接问题”)。不同的是,Marˇcenko Pastur方程(3.9)有一个自然的Bayesian解释:它提供了E的(限制)谱密度,条件是我们在特定的先验概率集合中选择的总体协方差矩阵C。5.3. 共轭先验估计。一旦我们设置了似然函数,下一步就是关注先验分布P(C),记住最终目标是计算BayesPostrior均值估计量(5.12)。不幸的是,对非平凡计算和闭式估计量的后验概率分布的评估因此很少。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:57:18
尽管如此,仍然存在一些类别的先验分布,其中后验分布可以精确计算。我们感兴趣的是统计学中的“共轭先验”类。粗略地说,假设我们知道似然分布P(E | C),那么如果先验分布P(C)和后验分布P(C | E)属于同一个分布族,则称其为共轭分布。作为一个例子,让我们先考虑一个热身的例子,然后再回到卵巢的估计。假设我们想要估计平均向量,比如u,给定我们观察到的N维向量数据y。此外,假设似然函数是具有已知协方差矩阵σIN的多元高斯分布。然后,通过在u上取一个高斯先验,其中“均值”和“协方差”矩阵τIN为零,可以很容易地检查p(u| y)=NNττ+σy,τστ+σIN!。(5.13)因此,μ的Bayes MMSE(5.9)由huiP(uy)=1给出-σσ+ τ!y、 (5.14)粗略地说,这就是著名的詹姆斯·斯坦估计量。事实上,James Steinestimator使用证据P(y),这种方法被称为经验Bayes(有关更多详细信息,请参见本节末尾)。现在人们可能想知道,我们是否可以将这种共轭先验性质推广到方差矩阵的情况,其测量过程由等式(5.11)中给出的似然函数P(E | C)表示。再次,我们将看到共轭先验方法产生了一个非常有趣的结果。使用(2.1)和第2.2节中介绍的势理论形式,很容易从等式中看出。(5.11)与高斯似然函数相关的势函数readsVq(E,C)=2q对数(C)+EC-1., (5.15)这显然是(2.58)中在外部电场E存在的情况下遇到的逆Wishart分布。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:57:22
因此,让我们引入一个具有两个超参数{γ,κ}asa的逆Wishart系综,对于C:P(C)=Z exp-NTr公司γlog C+κC-1.,Z是一个依赖于γ、κ和N的归一化常数。为了简单起见,我们将Hcip(C)=加在一起,很容易得到(忽略O(N)中的项-1) γ=κ+1。这是我们今后通过的公约。利用Bayes规则和高斯似然函数(5.11),我们发现后验分布也是一种逆Wishart分布,其形式为:P(C | E)∝ 经验值-Tr公司(T+ν+N+1)log C+T(2qκIN+E)C-1., (5.16)其中我们定义了ν:=N(2κ+1)-因此,我们期望Bayes估计量与James Stein估计量(5.14)明确相似,而ΞMMSEis的最终结果来自(2.59):ΞMMSE=TT+ν- N- 1(2qκIN+E)。(5.17)该估计器被称为线性收缩估计器,首次获得于[15],Ξlin=TT+ν- N- 1(2qκIN+E)≈1+2qκE+2qκ1+2qκIN+O(T-1) ,(5.18)更准确地说,它是一个逆Wishart分布IWN(N,N(2γ- 1) - 公式(2.58)中定义了1,2NκIN)。我们用T的地方→ ∞ RHS中的q=N/T定义。总之,我们导出了线性收缩估计量:Ξlin=αsE+(1- αs)其中αs=1+2qκ∈ [0, 1], κ > 0 . (5.19)对于James Stein估计量,该估计量告诉我们将样本协方差矩阵收缩到单位矩阵(我们的先验)上,强度由αs给出。我们在图5.1中给出了该估计量如何转换特征值的简单说明。特别是,我们看到小特征值向上提升,而顶部特征值向下拉动。此外,很容易看出该估计器与样本协方差矩阵E共享相同的特征向量。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:57:26
该属性在以下方面很重要。剩下的问题是,我们如何始终如一地选择参数κ(或直接选择αs),以便在实践中使用该估计器?在[15]中,哈夫推广了一种经验贝叶斯方法,类似于詹姆斯和斯坦[12]的工作。在高维领域,Ledoit&Wolf【16】注意到,这种方法可能会因经典估计量变得不可靠而受到影响,因此提出了αs的一致估计量。也有更直接的方法可以使用RMT工具直接从数据中估计参数κ。我们在第7.2.1节中总结了所有这些方法。最后可能会注意到,上述线性收缩估计的推导可以扩展到先验值不同于单位矩阵的情况。假设C的先验分布是广义逆Wishart分布:P(C)=Z exp-NTr公司γlog C+κCC-1.,其中,CI是一个矩阵(称为基本矩阵或先验矩阵),其可能具有非平凡的结构,编码我们对当前问题的看法。在这种情况下,很容易看出上述线性估计仍然成立,其中:Ξlin=αsE+(1- αs)Cαs∈ [0, 1]. (5.20)注意,当C6=IN时,P(C)不再具有旋转不变性。一个简单的示例是选择秒=(1- ρ) IN+ρJ,其中J的所有元素都等于单位。这对应于金融应用中的单因素模型,其中任何一对股票之间的相关性都是恒定的。这也可以看作是尖峰相关模型,如上文(3.56)所示,其中C=in,r=1,v=(1,1,…,1),d=(N- 1)ρ.现在,我们通过“不可观测”James Stein估计量(5.14)提出了经验Bayes方法。为了直接从数据中估计参数,这种方法是有用的,但它要求能够准确计算边际分布。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:57:32
如果我们重新考虑估计量(5.14)的框架,不难看出(5.2)中定义的证据P(y)由P(y)给出~ NN(0,(σ+τ)IN)。(5.21)回想(5.14),我们的目标是估算σ/(σ+τ)的比率,其中σ是已知的。为此,我们从(5.21)中注意到y~ (σ+τ)χN,(5.22),其中·是Lnorm,χ是N个自由度的卡方分布。因此,通过极大似然估计,我们可以得出σ×max(N- 2, 0)y≈σσ+τ,(5.23)0 1 2 3 4 5样本特征值012345清洁特征值无清洁线性收缩图5.1。与样本特征值(黑线)相比,αs=0.5的线性收缩(5.19)对特征值(蓝线)的影响。我们看到小特征值向上移动,大特征值向下移动。从而得出式(5.14)中不可观测项的估计值。因此,如果我们将这个样本估计插入(5.14),它会产生著名的James Stein估计:^uJS=1-σ×最大值(N- 2, 0)y!y,(5.24),它改进了当N>3.5.4时高斯种群平均值的最大似然估计。旋转不变先验估计。上述共轭先验类估计器的主要缺点是,它没有利用样本相关矩阵E的观测光谱密度中包含的大量信息。事实上,我们知道,它的Stieltjes变换gE(z)必须遵守与gC(z)相关的Marˇcenko Pastur方程,对于任何属于逆Wishartensemble的C,都不能保证服从这个关系。更准确地说,即使对于参数κ的最佳选择,gE(z)确实对应于具有反Wishart矩阵的特定gC(z)的可能性在N中也是指数小的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:57:37
这就是贝叶斯方法在大N极限下的特点:Cbelongs实际上受到Marˇcentko-Pastur关系的极强约束。在本节和下一章中,我们将讨论如何在实践中实现这些约束,从而构造C的真正一致估计量。让我们考虑一类属于Boltzmann类的旋转不变先验分布,公式(2.1),即P(C)∝ 经验值[-N Tr V(C)](5.25),其中V表示势函数。因此,很容易看到爪=OhmCOhm*对于任意N×北正交矩阵Ohm ∈ O(N)。换句话说,C的特征基在任何特定方向上都没有偏差。此外,使用高斯似然函数(5.11),后验分布读数为:P(C | E)=Zexph-N Tr V(C,E)i,V(C,E)…=Vq(C,E)+V(C),(5.26),其中Vq在等式(5.15)中定义。因此,可以推导出等式:P(C | E)=P(OhmCOhm*|OhmEOhm*), (5.27)因此,Bayes MMSE估计器等式(5.9)服从以下性质:hCiP(C | E)=ZOhmCOhm*P(OhmCOhm*|E) DC=OhmZCP(C|Ohm*EOhm)直流Ohm*≡ OhmhCiP(C|Ohm*EOhm)Ohm*(5.28)我们改变变量C的地方→ OhmCOhm*并在最后一步中使用公式(5.27)。现在我们可以随时选择Ohm = U使U*欧盟是对角线。在这种情况下,使用对称参数不难说服自己hCiP(C | U*EU)也是对角线。上述结果简单地表示,一般而言,C的MMSE估计量与E在相同的基础上是对角的——参见Takemura【129】和其中的参考文献:ΞMMSE=UΓ(λ)U*, (5.29)美国∈ RN×Nis E和Γ(λ)=diag(γ(λ),γN(λ))是一个N×N对角矩阵,其条目是样本特征值∧=对角(λ,λ,…,λN)的函数。我们看到,假设先验旋转不变,贝叶斯估计问题被简化为寻找一组最优特征值γi(∧)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:57:41
该框架与线性收缩估计量(5.19)完全一致,其中γi(λ):=αsλi+(1- αs),可以看作是广义收缩估计量。在详细讨论Γ(λ)的显式形式之前,让我们假设C的先验分布具有旋转不变性。假设我们没有关于N维空间中可能的特权方向的先验信息,这将允许我们在这些特殊方向上偏移估计器Ξmms的特征向量。在这种情况下,我们估计量Ξmmsemu的唯一合理的特征基必须是我们所掌握的(有噪声的)观测值E,这是有意义的。任何满足式(5.28)的估计量将被称为旋转不变估计量(RIE)。然而,我们强调,当电子揭秘一些非平凡结构时,这种假设不是最优的。一个例子是财务相关矩阵的顶部特征向量,它明显偏向(1,1,…,1)方向。然而,处理此类非旋转不变量对象更为困难(有关此主题的讨论,请参见[38,40]和第9章)。我们现在可以在RIEs类中导出最优Bayes估计的显式形式。估计量Ξmms的特征分解(5.29)表明γi的特征值≡ γi(λ)可以写成γi=hui,hCiP(C | E)uii,其中我们使用了hCiP(C | E)在U基上是对角的事实。经过一番思考,我们可以看到以下身份成立:NTr(zIN)- E)-1hCiP(C | E)=NNXi=1γiz-λi,(5.30),这将允许我们提取我们正在寻找的γiwe,即确定Bayes估计器的最佳收缩函数(5.29)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:57:44
为此,我们调用了通常的自平均性质,该性质适用于非常大的N,因此我们可以在最后一个方程中取E的边际概率的平均值,得到:Tr(zIN)- E)-1hCiP(C | E)=Tr公司(zIN)- E)-1hCiP(C | E)P(E)=Tr公司(zIN)- E)-1C级P(C | E)P(E)。(5.31)使用Bayes公式(5.1),我们重写了最后一个方程Asr(zIN)- E)-1hCiP(C | E)=Tr公司(zIN)- E)-1C级P(E | C)P(C)=Trh公司(zIN)- E)-1.P(E | C)CiP(C)。(5.32)我们在最后一行中认识到,对于给定的人口矩阵C,E的Stieltjes变换的定义,这允许我们使用第3章和第4章中介绍的Marˇcenko Pastur形式主义。因此,由于特征值λi在极限N内是确定的→ ∞ (见第3章),我们得出大型NNTr(zIN)- E)-1hCiP(C | E)≈ZρE(λ)dλZ-λNXj=1ujΦ(λ,uj)C、 (5.33)其中Φ(λ,u)是等式(4.3)中定义的均方重叠。通过比较等式。(5.30)和(5.33),我们可以很容易地得出γ(λ)≡ γ(λ) =NXj=1ujΦ(λ,uj)C~ZuΦ(λ,u)ρC(u)du,(5.34),其中我们再次使用“遍历假设”【127】作为N→ ∞ 在最后一步中。因此,我们可以看到,在大N限值下,我们能够找到Bayes估计量(5.29)的最优收缩函数γ的闭合公式,该公式取决于第4章中研究的均方重叠和先验谱密度ρC。不同的是,最终结果等式(5.34)是明确的,但似乎仍取决于我们为C选择的先验值。事实上,正如我们将在下一章中看到的,等式(5.34)可以根据E本身的知识进行估计,也就是说,无需对先验知识做出任何明确的选择!这与我们在本节开始时的讨论一致:对于大N,观察E的光谱分布足以确定C所属的正确的先验系综。为了说明结果(5.34),我们在本节末尾进行了自一致性检查。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:57:47
如上所述,非线性收缩函数(5.34)概括了线性收缩(5.19)。为了强调这一点,我们假设C是各向同性的逆Wishart矩阵,因此先验谱密度ρCis由等式(2.53)给出。我们在图5.2中绘制了我们使用ourBayes估计器(5.19)(红点)获得的特征值,这些特征值来自E的单个实现,C是大小为N=500的逆Wishartmatrix。已选择先验分布参数,使收缩强度等于一半。我们看到,一致性非常好,显示了遍历假设的有效性,同时,在这个特殊的例子中,也显示了RI-Bayes估计量(5.34)的有效性。在第6.4.2节中,我们将明确指出,当C是各向异性逆Wishart矩阵时,等式(5.33)再现了等式(5.19)。0 1 2 3 45λ0.511.522.53λ^线性收缩(α=0.5)Rie图5.2。我们的分析RI-Bayes估计量(5.34)(红点)与理论结果Q的比较。(5.19)(蓝线)当先验分布为逆Wishart(2.58)时。参数为N=500、q=0.5和αs=0.5.6。一般协方差矩阵的最优旋转不变估计6.1。Oracle估计器。在前一章中,我们介绍了一个贝叶斯框架,以使用我们所掌握的数据Y来构建总体相关矩阵C的估计量。我们表明,使用共轭先验假设自然会产生一类线性收缩估计量,这可以说是对这一主题最有影响力的贡献之一。它被成功地用于许多环境中,作为一种在高维环境中提供抗噪声鲁棒性的简单方法(参见[10、15]或[130],了解更多最新评论)。然而,关于这个估计器的主要担忧是,对于largeN来说,共轭先验系综在手头的数据中是不可能的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:57:52
为了充分利用样本相关矩阵的谱密度信息,我们引入了一类旋转不变先验分布。在此框架下,我们导出了在大维数极限下有效的最小均方误差(MMSE)估计量的显式公式,该公式可以看作是一个非线性收缩过程。在这一章中,我们想说明得到的估计量也可以理解为所谓的“oracle”估计量。这种观点的变化非常有趣,因为它表明上述贝叶斯估计量的基础比预期的要广泛得多。假设一个人实际上知道总体矩阵C,因此得名“甲骨文”,但他决定创建一个C的估计量,该估计量被限制为具有预定的特征基U。(在实践中,该特征基将是样本相关矩阵E的特征基)。估计真矩阵C的最佳方法是什么?这个基本的想法乍一看可能很奇怪,因为我们根本不知道C!但正如我们将在下面看到的,oracle估计量将与MMSE估计量一致,对于大N,MMSE估计量完全可以用可观测量表示。更准确地说,让我们引入实对称有限正N×N矩阵的集合M(U),这些矩阵在基U=[ui]i上是对角的∈[1,N]。Lsense中M(U)中C的最优估计量由:Ξora给出argminΞ∈M(U)Ξ -C五十、 (6.1)发现这个二次优化问题的解很简单,如:Ξora=NXi=1ξora。iuiu*i、 ξora。i=hui,Cuii。(6.2)这提供了C的最佳估计量,因为我们“坚持”使用特征基i∈[[1,N]]。如果我们将其改写为C的IGenvectors的函数,即ξora,则可以更好地理解该估计量的含义。i=NXj=1ujhui,vji。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:57:55
(6.3)事实上,我们从最后一个方程中可以看出,oracle估计量是由总体特征值的加权平均值给出的,其权重是由从强制基Ui到真基Vjj的过渡给出的∈ [[1,N]]。因此,“oracle”估计器(6.2)明确使用了估计器位于错误基础的事实。回到我们对给定样本矩阵E的C的估计,很明显,如果我们对C的真实特征基没有任何信息,唯一的可能性是使用E本身的特征基作为U。这相当于C的旋转不变先验分布的假设,但我们这里不依赖任何贝叶斯参数。现在,我们注意到在极限N→ ∞,[ξora.i]i的预言特征值∈[[1,N]]确实等同于RI-Bayes-MMSE公式(5.34),但在等式(6.2)中,总体矩阵C是(确定性)一般协方差矩阵。Bayes估计量(5.34)和无条件估计量之间的等价性并没有超出大N限,并且在不同的上下文中已经提到过[130131]。6.2. 最优RIE的显式形式。出于实际目的,oracle估计器(6.2)看起来毫无意义,因为它涉及矩阵C,而矩阵C正是我们希望估计的数量。但在高维极限下,发生了一种“奇迹”,即oracle估计收敛到不再涉及矩阵C的确定性RIE。让我们推导出这一公式,首先计算整体特征值,然后计算异常值——更令人惊讶的是,这两种情况下的最终表达式完全相同。6.2.1. 大宗商品。最近的不同工作考虑了有限维极限下体积特征值的最优非线性收缩函数的推导。第一个是Ledoit&P’ech’e的工作【36】。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:57:59
最近,在更一般的框架中考虑了该oracle估计器[37](包括加性噪声模型的情况,见附录D),其结论是,只要能够确定等式(4.3)中定义的均方重叠Φ(λi,uj)的收敛性,即可轻松计算oracle估计器。更准确地说,让我们x i>r+1,我们期望在大维度的极限下,对于任何j=1,…,平方的verlaps hui,vji,N将显示渐近独立性,以便应用大数定律,从而得出ξora的确定性结果。i、 因此,对于大N,对于任何i>r,ξora,我们都有。i=NXj=1ujΦ(λi,uj)≈NπρE(λi)limη→0+即时消息NXj=1uj(ziIN- E)-1jj, (6.4)其中,我们使用了结果等式(4.9),其中zi=λi- iη。使用Marˇcenko Pasturrelation(3.11)并在简单的代数运算后得出ξora。我~qπρE(λi)limη→0+即时消息1.-1.-q+qzigE(zi),这可以进一步简化为oracle估计器的最终Ledoit-P'ech'e公式[ξora.i]i∈[[r,N]]:ξora。我~^ξ(λi)与^ξ(λ)=λ1.-q+qλlimη→0+gE(λ-iη), (6.5)其中|·|表示复模量。我们注意到,最后一个方程的RHS不再涉及矩阵C,只依赖于确定性量。这就是我们上面提到的大N极限的“奇迹”:先验的不可观测oracle估计器收敛到一个可以直接从数据估计的确定量。6.2.2. 异常值。通常,导出异常特征值的oracle估计器的极限值所需的参数,即ξora。对于i 6 r,与上面用于体特征值的有点不同。事实上,后者明确要求%E(λi)的密度不为零(例如,假设最大r特征值为异常值。N→ ∞) 正如我们从第3章所知道的,这不是异常值的情况。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:58:03
因此,【36】和【37】的方法不再有效。但令人惊讶的是,最终结果恰好与等式(6.5)相同!这是最近在[38]中建立的,该方法的出发点是将oracle解决方案写入ξora。i=rXj=1ujhvj,uii+NXj=r+1ujhvj,uii,(6.6),从中,我们还使用第4节的结果得出结论,如果r是有限的,则上述两个项对i 6 r都有非消失贡献。粗略地说,第一个和将对j=i贡献inO(1),第二个和给出O阶项((N- r) ×1/N)~ O(1)。我们从方程式(6.6)RHS中的第一个简单术语开始。事实上,回想一下。(4.14)任何离群特征向量Ui集中在轴线平行于过孔的圆锥上,且在与Vjj正交的任何方向上完全离域∈ [[1,N]],j 6=固定。因此,唯一有助于主导订单的是hvi,uii,因此我们得出结论,Rxj=1ujhvj,uii~ uiθ(ui)θ(ui)(6.7),其中我们在最后一步中使用了公式(3.62)。公式(6.6)中的第二项更难处理。由于r是有限的,因此比N小得多,我们可以假设第二个和将集中在其平均值附近,即NXj=r+1ujhvj,uii~NXj=r+1ujEhvj,uii。第4节评估了RHS中j>r+1和i 6 r的均方重叠,结果见等式(4.16),为方便起见,我们在此回顾:E[hui,vji]=uiθ(ui)ujT(ui- uj),i 6 r,j>r+1。因此,我们发现r N【38】NXj=r+1ujhvj,uii~uiθ(ui)TNXj=1uj(ui- uj),(6.8),其中注意到RHS之和从j=1到N。我们可以使用Marˇcentko Pastur方程(3.35)简化最后一个方程中RHS的和。实际上,通过设置z=θ(ui),i 6 r和θ在公式(3.62)中定义,公式。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:58:06
(3.35),变为θ(ui)=ui+TNXj=1u-1j- u-1i(6.9),通过取ui的导数,该屈服强度nxj=1uj(ui- uj)=1-θ(ui),(6.10)对于任何i 6 r。通过将此恒等式插入等式(6.8),我们得到nxj=r+1ujhvj,uii~uiθ(ui)1.-θ(ui), (6.11)对于任何i 6 r。总之,我们可以通过插入式方程式看到。(6.7)和(6.11)转化为等式(6.6),最终得到ξora。我~uiθ(ui),(6.12),即异常值的oracle估计值也收敛到一个非常简单的确定值,但取决于不可观测的总体特征值。然而,使用公式(3.62),我们可以将公式(6.12)的RHS重写为样本特征值的函数。首先,注意θ(ui)=λifor N→ ∞ 根据公式(3.62)。此外,我们还可以将公式(3.62)倒置以找到ui~gS(λi)=λi1-q+qλigE(λi),对于任何i 6 r,我们在最后一步中使用关系式(3.33)。因此,我们推断,在高维极限下,我们可以将公式(6.12)改写为ξora。我~λi1.-q+qλigE(λi). (6.13)我们发现,结果与整体特征值的结果相似,但对于异常值,我们需要无尖峰、有效样本协方差矩阵E的Stieltjes变换。但考虑到极限N→ ∞, 我们很容易使用Weyl的交错不等式[126]推断,我们可以用E的Stieltjes变换来代替它,这样我们最终得出结论,对于任何异常值i 6 r,ξora。我~^ξ(λi),(6.14),其中(6.5)中定义了最佳收缩函数^ξ。我们看到,oracle估计器的离群值也收敛到一个确定性函数,该函数与大N→ ∞.综上所述,我们发现oracle估计收敛到一个极限函数,该极限函数不需要明确的C知识,并且与前一章中获得的Bayes MMSE估计相同。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:58:09
此外,该函数是“通用”的,因为清除大量特征值和异常值所需的最佳非线性收缩由限制N中的同一函数给出→ ∞, 这对于实际应用非常有吸引力。该函数在等式中定义。(6.5)或(6.14),只需要了解E的Stieltjes变换,这是可以观察到的-见下文。6.3. “清洁”特征值的一些性质。尽管最优非线性收缩函数(6.26)似乎相对简单,但尚不清楚转换λi会产生什么影响→^ξ(λi)。在本节中,我们给出了最优估计量Ξora的一些定量性质。了解最佳非线性收缩函数^ξ(λ)的影响。首先让我们考虑Ξora谱的矩。。从式(6.3)中,我们立即得出:TrΞora=Xj=1ujv*jXi=1IU*我!vj=TrC,(6.15),这意味着清洁操作保留了人口矩阵C的痕迹,正如它应该的那样。对于oracle估计量的阶数2,我们有:Tr(Ξora.)=NXj,k=1ujukXi=1hui,vjihui,vki。现在,如果我们将矩阵P定义为j,k=1,N的{Pi=1hui,vjihui,vki},则不难看出它是一个具有非负项的平方矩阵,其行总和为单位。因此,matrixP是一个(双)随机矩阵,Perron-Frobenius定理告诉我们,它的最大特征值等于1。因此,我们推导出以下一般不等式nxj,k=1Pj,kujuk≤NXj=1uj,这意味着Tr(Ξora.)6 TrC6 TrE,(6.16),其中最后一个不等式来自等式(3.17)。换句话说,这个结果表明Ξora的光谱。比C的谱更窄,C的谱本身也比E的谱更窄。因此,最优RIE告诉我们,我们最好更加“谨慎”,而不是简单地将样本特征值带回其估计的“真实”位置。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:58:12
这是因为我们只有关于C的真本征基的部分信息。特别是,与它们的“真”位置uIforAnyi相比,应该始终向下(或向上)收缩顶部(或较小)的本征值∈ [[1,N]],除了微不足道的情况C=IN。因此,估计总体特征值【ui】i∈[[1,N]]并不是在只有部分特征向量信息的情况下,获得C的最优估计量所应该做的。我们在图6.1中提供了一个示例,其中我们认为C是参数κ=1的逆Wishart矩阵。接下来,我们考虑oracle估计量的渐近行为,我们从Eqs中回忆了该估计量。(6.5)和(6.14)ξora。我~^ξi,带^ξi=λi | 1-q+qλilimη↓0gE(λi- iη)|。在下文中,假设suppρean下界左侧有一个异常值,并假设q<1,因此E没有精确的零模。从第6.2.2节开始,我们知道估值器(6.5)适用于异常值。此外,我们还有limλ→0+gE(λ)是实的和解析的,因此我们从公式(3.23)中得出λgE(λ)=O(λ)表示λ→ 0+. 这允许我们从公式(6.5)得出结论,对于非常小的异常值,limλ→0+^ξ(λ) =λ(1 -q) +O(λ),(6.17),这与公式(6.16)一致:q的小特征值增强∈ (0, 1).回想一下,为了简单起见,我们假设C为正定义。0 1 2 3 45λ0123ρ(λ)信号密度样品密度清洁密度图6.1。当先验值是参数κ=1的逆Wishart时,评估q=0.5的信号、样本和清洁密度的特征值密度。我们看到,清洁后的密度是最窄的石头,而样品是最宽的,正如预期的那样。另一个渐近极限λ→ ∞ 也很有用,因为它为我们提供了大型异常值的非线性收缩函数^ξ的行为。在这种情况下,我们从Eq。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:58:15
(3.16)limλ↑∞λgE(λ)~1 + λ-1Д(E),其中Д表示归一化跟踪运算符(2.61)。因此,我们得出结论LIMλ→∞^ξ(λ) ≈λ1+qλ-1Д(E)+O(λ-2)~ λ - 2qД(E)+O(λ-1) ,(6.18)如果我们使用Tr E=Tr C=N,我们只得到limλ→∞^ξ(λ) ≈ λ - 2q+O(λ-1). (6.19)有趣的是,将其与著名的“Baik Ben Arous-P'ech'e”(BBP)结果进行比较,该结果仅适用于较大的异常值【118】,其读数为(见等式(3.64))λ≈ λ的u+q→ ∞. 因此,我们从eq推导。(6.19)^ξ(λ)≈ u - 因此,对于孤立的大特征值λ和q>0,我们发现以下排序关系^ξ(λ)<u<λ,(6.20)。同样,该结果与公式(6.16)一致:对于任何q>0的情况,大特征值应减少,甚至低于异常值u的“真”值。更一般地,非线性收缩函数^ξ在λ/(1)之间平滑插值-q) 对于小λ到λ- 2q表示大λ。尽管我们没有设法证明它,但我们认为这是极限最优非线性收缩函数(6.5)相对于样本特征值是单调的这一事实的另一个表现。6.4. 一些分析示例。在某些完全可以解决的情况下,oracle收缩过程的上述一般属性可以得到更多的体现。在本节中,我们提供了两个简单的玩具模型,其中函数^ξ(λ)可以在转向数字插图之前明确表征。6.4.1. 无效假设。第一个是无效假设C=在这里我们将看到,一个预期的ξora。(λi)=1,对于大部分分布中的任何特征值[λi]i>r+1。在光谱之外,我们观察到类似于BBP转变的“相变”现象【118】,这导致了一个非平凡的收缩公式。我们从E的异常值开始。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:58:18
根据我们模型的假设,所有的异常值都有N阶贡献-1在极限N内→ ∞, gEis real and analytic for anyλi with i 6 r。因此,通过将Stieltjes变换(2.41)插入公式(6.5)中,可以很容易地获得估算值,结果如图6.2所示。对于体特征值,可以更明确地进行计算。首先,使用公式(2.41),一个结果1-q+qzgE(z)=(z+1- q) ±p(z+q- 1)- 4zq。对于z=λ-带λ的iη∈(1 -√q) ,(1+√q), 我们知道后一个方程中的平方根对于η是虚数→ 0+. 因此,如果我们取平方模量,则得到一个很小的η→01.-q+qλgE(λ-iη)=(z+1- q)+4λq-(λ+q-1),我们很容易从中得出η→01.-q+qλgE(λ-iη)= λ、 这就给出了期望的答案^ξ(λ)=1,λ∈(1 -√q) ,(1+√q). (6.21)我们在图6.2中提供了该相变的图示,其中C=in,对应于矩阵E,使用q=0.5的各向同性Wishart矩阵生成。它还验证了大型孤立特征值方程(6.19)的渐近预测。6.4.2. 重新审视线性收缩。在第5章中,我们看到线性收缩(朝向一致性矩阵)等价于假设C本身属于具有某些参数κ的逆Wishart集合。我们希望在本章的框架内重新审视这一结果,我们将看到,在存在额外尖峰的情况下,最佳收缩函数(6.5)再次显示了相变现象,因此不同于E谱之外的线性估计量公式(5.19)的IgenValue。对于上述零假设情况,对于异常值没有特殊的简化,可以立即从公式(6.5)和(3.41)中获得数值结果。对于体积分量,等式(3.41)中的平方根项变为虚项。因此,设置z=λ- iη转化为等式。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:58:23
(3.41)带λ∈ [λiw-, λiw+]和λiw±,在公式(3.42)中定义,得到1.-q+qλlimη→0+gE(λ-iη)=λ(1+qκ)+κq(1-q)+ q2λκ(κ(1+q)+1)- κ(1 -q)- λκ(λ+2qκ),κ>0。将正方形展开后,可以将其重写为1.-q+qλlimη→0+gE(λ-iη)=λ(1+2qκ)(λ+2qκ)。(6.22)0 1 2 3 4 5λ012345^ξ(λ)RIEno清洁图6.2。C=INas的最优RIE特征值的计算样本特征值的函数[λi]i∈[[1,N]]对于q=1/2。非线性收缩函数用普通蓝线绘制。我们可以看到λ>(1+√q) ,发生相变,相应的“清洁”特征值在较大λ到λ时收敛- 2q(红色虚线向下移动2q=1)。当一个人接近频谱边缘时,请注意估计器的平方根奇异性。离群值λ<(1)存在类似的相变-√q) (见图6.4)。通过将最后一个方程插入式(6.5)中,得出了任意λ∈ [λiw-, λiw+]ξora。(λ) =λ+2qκ1+2qκ,(6.23),如果我们回忆起定义αs=1/(1+2qκ)∈ 公式(5.19)中的[0,1],我们精确地检索到线性收缩估计量(5.19),ξora。(λ) ~ αsλ+(1- αs),λ∈ [λiw-, λiw+]。(6.24)最后一个结果说明了在特定情况下,最优RIEΞora之间的真正联系。LDL中的andBayes最优推理技术。特别地,我们证明了对于各向同性逆shart矩阵,估计量Ξora。在高维区域给出了与共轭先验方法相同的结果。然而,这仅对体组分有效,因为离群值的存在会导致最优RIE的相变,这在对离群值视而不见的共轭优先理论中是不存在的。我们在图6.3中说明了最后一点,其中C是参数κ=2的反向Wishart矩阵。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:58:27
在[37]中已经注意到了高维区域中贝叶斯统计与RIE之间的联系,其中还考虑了加性噪声的情况——参见附录D,从而得出了著名的维纳信号对噪声最优估计的推广[132]。我们还在图6.4中说明了两个分析示例中,在光谱下界左侧观察到的异常值相变。我们看到,对于非常小的特征值,理论预测(6.17)非常准确。随着λ向左边缘移动,该预测的效果越来越差。0 1 2 3 4 5λ0.00.51.01.52.02.53.03.54.0^ξ(λ)瑞尔线收缩图6.3。k=2为样本特征值函数[λi]i的逆Wishart先验最优RIE特征值的评估∈[[1,N]]。矩阵E使用Wishart矩阵生成,参数N=500,q=0.5。非线性收缩函数用普通蓝线绘制,它与估计量公式(5.19)(红色虚线)一致。然而,我们看到,对于λ>λiw+,会发生相位转换,并且两个估计器会分裂。λ<λiw+(见图6.4)也观察到同样的现象。6.5. 工作中的最佳RIE。为了结束本节,我们现在考虑ge(z)不明确的不同情况,以及必须用数值方法解决问题的不同情况。在这种情况下,主要问题是估计函数gE(z),而不将任何“先验”强加给C。事实上,即使考虑函数ξora。仅取决于可观测量,我们仍然需要仅使用有限(和随机)样本特征值集来估计函数ge(z)。这个问题最近在[38]中得到了解决,除了将[36]的结果扩展到异常值(如上所述),在[38]中使用的数学技术还提供了Q的推导。(6.5)在当地规模和任何大型但有限的N。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:58:35
如第4章所述,localscale可以理解为宽度η=dλ>N的特征值小区间上的平均值-1、[38]的主要结果可以总结如下:极限Stieltjes变换gE(z)可以用其离散形式gne(z)=NNXi=1z来代替-λi,(6.25)具有高概率(有关确切的陈述,请参见例如[111])。因此,这产生了一个完全可观测的0.00 0.02 0.04 0.06 0.08 0.10λ0.00.20.40.60.81.0^ξ(λ)RIE(逆Wishart)RIE(零假设)λ/(1- q) 2图6.4。将预测公式(6.17)(红色虚线)与零假设(6.21)(绿色虚线)和反向Wishart先验(6.24)的分析解(参数κ=2)(蓝色普通线)进行比较。在这两种情况下,湿设定q=0.5。当λ靠近左边缘时,渐近预测(6.17)变得越来越不准确,而解析解(蓝线)描述了相位转换。非线性收缩函数,以及η=N的选择-1/2为任何有限N和T提供了一个精确的误差上限。精确地说,对于zi=λi- 在里面-1/2,存在常数K,对于足够大的T,ξora。我-^ξNiK√T、 ^ξNi≡^ξN(λi)=λi1.-q+qzigNE(zi), (6.26)前提是λiis不接近零[38]。我们可以看到,公式(6.26)非常容易用数字实现,因为它只需要计算N项上的和。现在,我们对人口矩阵C在四种不同设置下的有限N、可观测的最佳非线性收缩函数(6.26)的准确性进行了数值测试。我们选择N=500,T=1000(在实际情况下,这是非常合理的数字,既不太小也不太大),并考虑以下四种不同的情况:(i)对角线矩阵,其ESD由多个具有“尖峰”的源组成,ρC=0.002δ+0.002δ+0.396δ+0.3δ1.5+0.3δ。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群