全部版块 我的主页
论坛 经济学人 二区 外文文献专区
2022-6-15 15:58:38
(6.27)(ii)变形GOE,即C=IN+GOE(宽度σ=0.2),额外尖峰位于{3,3.5,4.5,6}。(iii)条目Cij=0.6 | i的Toeplitz矩阵-j |尖峰位于{7,8,10,11};(iv)幂律分布特征值(见[28]和第3章),λ=-0.6(或λmin=0.8)。对于ui的经典位置,使用一个大的N代理,可以得到[28]:ui=-λ+(1+λ)rNii∈ [[1,N]]。(6.28)请注意,最后的幂律分布会自动生成有界数量的异常值。此外,由于我们在N和T有界的情况下工作,C的最大特征值仍然有界。我们绘制了图6.5中估算器公式(6.26)和oracle估算器公式(6.2)的结果。总的来说,估计器(6.26)对总体特征值和异常值都给出了准确的预测。我们考虑了几种异常值的配置。对于(i)的情况,我们可以看到两个孤立的doutliers是正确估计的。对于变形的GOE或Toeplitz情况,选择的离群值彼此接近一点,结果与oracle估计一致。对于幂律分布频谱的更复杂情况,没有明显的右边缘,我们可以看到(6.26)再次与oracle估计器很好地匹配。然而,我们注意到,经验最优RIE(6.26)系统地低估了小特征值。第8章将对这种影响进行更详细的研究。作为进一步检查,我们在此提供了“最佳”标度η的数值测试。如上所述,【38】中显示的值η=N-1/2提高了(6.26)中的上限。然而,人们可能想知道,对于真实(或合成)数据,这个值是否确实是最优的。为了验证这一点,我们研究了作为η函数的估计器(6.26),并计算了与oracle估计器Ξora相对应的均方误差。对于η=αN-1/2和α∈ [0.01, 50].
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:58:46
对于每个C,我们使用多元高斯过程评估100种不同实现E的误差。结果如图6.6所示。α的最佳值≈ 1.5对于所有示例,C是Toeplitz矩阵(黄色点)时除外,其中α的最佳值≈ 8.4.6.6. 自由乘法模型的扩展。如【37】中所强调的,对整体特征值的最佳RIE的评估可以扩展到更一般的乘法随机矩阵模型(对于加性噪声模型,请参见附录D)。特别是,可以(正式)推导出测量模型(2.80)的整体特征值的最佳非线性收缩函数(6.5),该模型推广了样本协方差矩阵的情况(见第3.2.1节)。为此,让我们定义M..=C1/2OhmBOhm*C1/2式中,B是N×N对称旋转不变量噪声项,且Ohm 是根据Haarmeasure分布的N×N随机旋转矩阵。可以很容易地从公式(2.100)中检查出Tr[GM(z)C]=N(zgM(z)- 1) SB(zgM(z)- 1) . (6.29)利用S变换的解析性,我们定义了函数γ带ωb,例如:limz→λ-i0+SB(zgM(z)- 1) :=γB(λ)+iπρM(λ)ωB(λ),(6.30),因此,自由乘性噪声模型(2.80)的体特征值的最佳RIE可以从(6.4):ξora中推断出来。我~ F(λi);F(λ)=λγB(λ)+(λhM(λ)- 1) ωB(λ)。(6.31)注意,可以通过插入等式来检索估计器(6.5)。(2.44)和(6.30)转化为等式(6.31)。我们省略了[37]中的细节,并得出结论,公式(6.31)确实概括了Seq。(6.5). 我们再次看到,最终的解决方案并不明确依赖于C,但在某种程度上要求a优先于矩阵B的光谱分布。在(a)多个源(案例(i))中找到模型将非常令人满意。(b) 变形GOE(案例(ii))。(c) 托普利茨(案例(iii))(d)幂律(案例(iv))图6.5。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:58:49
对于第6.5节开头的四种情况,数值估计的oracle估计量(6.26)(红线)与精确的oracleRIE估计量(6.2)(蓝点)进行比较,N=500,T=1000。结果来自于使用多变量高斯测量过程实现E的单个实现。我们可以得到公式(6.31)的显式公式(该模型的一些相关应用见第9章)。我们顺便强调,我们也可以使用公式(2.100)推导出大部分分布的均方重叠(4.3)。为此,我们调用关系式(4.9)和等式(2.100)来获得[37]:Φ(λ,u)=μβm(λ)(λ- uαm(λ))+πuβm(λ)ρm(λ),(6.32),其中我们定义了函数α和βmasαm(λ):=limz→λ-i0+ReSB(zgM(z)- 1)βm(λ):=limz→λ-i0+ImSB(zgM(z)- 1)πρM(λ),(6.33),下标M表示“乘法”。10-210-1100101102√Nη202530354045505560 | |Ξ(η)- Ξora||2身份反向WishartDeformed GOEToeplitzPower定律图6.6。最优估计量(6.26)和oracle估计量之间的均方差。现在将估计器(6.26)作为η的函数进行研究。x轴(对数刻度)显示α值=√为了清楚起见,Nη。我们考虑了五个不同的C示例(与图6.5和单位矩阵中的配置相同)。对于每个示例,我们生成100个独立的E实现,其中N=500,T=1000。我们在结束本技术部分时,提到了一个开放的问题,即这些结果在存在异常值的情况下的扩展。事实上,很有意思的是,看看最优RIEformula(6.31)是否仍然是通用的(正如我们所认为的那样),因为大块特征值和异常值的清理公式是相同的。块矩阵表示法(C.8)在这方面可能很有用。应用:马科维茨投资组合理论和之前的“清理”方案7.1。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:58:53
马科维茨最优投资组合理论。对于不熟悉马科维茨最优投资组合理论的读者,我们在本节中回顾了一些最重要的结果。假设投资者想要投资一个包含N种不同资产的投资组合,并确定最佳“权重”。一种直观的策略是所谓的均值-方差优化:投资者寻求分析,以便在给定预期回报目标的情况下,将投资组合的总体二次风险降至最低。不难看出,这种均值-方差优化可以转化为具有线性约束的simplequadratic优化程序。在进入更多的数学细节之前,让我们介绍一些将在下面使用的符号。我们假设我们观察N种不同股票的回报时间序列。对于每种股票,我们观察到一个大小的时间序列,其中T在实践中通常大于N。这将产生(归一化)N×T返回矩阵xy=(Yit)∈ RN×t真实相关矩阵由Hyityjti=Cijδtt(7.1)定义,其中时间方向上没有相关性只是第一个近似值,因为已知股票市场中存在微弱但持久的线性相关性。在当前的“大数据”时代,我们自然而然地将自己置身于高维生活中,T→ ∞ 有限比率q=N/T。马科维茨的最优投资组合相当于解决以下二次优化问题minw公司∈RNw公司*Cws。t、 w*g级≥ G(7.2),其中G是预测因子的N维向量(假设是确定性的,由经济数据的深度分析等给出),G是预期收益。通过引入拉格朗日乘子γ,将这个有约束优化问题改写为无约束优化问题,可以很容易地解决这个数学问题:minw∈RNw公司*Cw公司- γw*g。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:58:56
(7.3)假设C是可逆的,不难找到最优解和γ的值,因此总体预期收益率正好是G。由wc=GC给出-1克*C-1g,(7.4)这需要C和g的知识,这是先验未知的。如上所述,根据投资者的信息和预期,形成未来回报预期是投资者或财务分析师的工作,因此我们假设g是给定的。即使这些预测完全错误,寻找与这些预期一致的最低风险投资组合仍然是有意义的。我们仍然面临着估计C的问题,或者可能是C-1重新应用马科维茨公式前,等式(7.4)。我们将在下文中看到,为什么在反转C并确定权重之前,应该找到C本身的最佳估计量。我们可以检查所谓的Karush-Kuhn-Tucker条件是否满足。这种分配策略的最小风险是什么,衡量为投资组合回报的方差?如果知道总体相关矩阵C,则与WC相关的真正最优风险将由true给出..=hwC,CwCi=Gg*C-1克。(7.5)然而,最佳策略(7.4)在实践中无法实现,因为矩阵C未知。那么我们可以做什么呢?投资组合的已实现风险估计有多严重?7.1.1. 预测和实现的风险。使用马科维茨最优投资组合的一种非常天真的方法是使用经验矩阵E而不是C来应用(7.4)。回顾第3章和第4章的结果,不难看出,只要T与N相比不够大,这种策略就会受到强烈偏差的影响,这正是我们在这里考虑的情况。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:59:00
尽管如此,使用经验矩阵E的最佳投资权重为:wE=GE-1克*E-1g,(7.6),因此,该投资组合的最低风险为byRin=hwE,E wEi=Gg*E-1g,(7.7),称为“样本中”风险或预测风险。让我们假设g与C(因此也与E)无关。然后,使用关于g的E的凸性*E-我们从Jensen不等式中发现*E-1g]>g*EE-1g=g*C-1g(7.8),因为E是C的无偏估计量。因此,我们得出结论,样本内风险低于“真实”风险,因此,我们的最优投资组合受到样本内偏差的影响:其预测风险低估了真实的最优风险,而未来的样本外风险或已实现风险更是如此,即在估计期之后的时期内实现的风险。让我们用这个样本外周期的经验矩阵来表示;样本外风险自然由以下定义:Rout=hwE,EwEi=Gg+E-1EE-1g(g+E-1g)。(7.9)对于大型矩阵,我们期望结果是自平均的,并由其期望给出。因为我们可以假设噪声独立于E中的噪声,所以我们得到大N[133]:w*EEwE公司≈ w*ECwE(7.10)和one很容易从等式(7.5)为最小可能风险的事实中得出以下不等式:Rtrue6 Rout。我们在图7.1中绘制了这些不平等的图示,使用等效风险度量是波动率,它只是投资组合策略方差的平方根。所谓的有效边界,我们假设g=(1,…,1)*. 对于给定的C(这里是围绕单位矩阵的移位GOE,σ=0.2),我们构建WC并比较等式。(7.5),(7.7)和(7.9),q=0.5。我们看到,使用wEis显然过于乐观,可能会在实践中导致灾难性的结果。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:59:05
我们强调,这一结论适用于不同的风险衡量标准【6,7】。0 20 40 60 80 100 120 140 160hw,Cwi020406080100Gtruepredicted(样本内)实现(样本外)图7.1。与g=(1,…,1)的均值-方差最优投资组合(7.4)相关的有效前沿*C a围绕单位矩阵移动GOE,σ=0.2,q=0.5。蓝线将预期收益描述为真实最优风险(7.5)百分比的函数。绿线表示预测(样本内)风险,红线表示已实现(样本外)风险,远高于真实风险。7.1.2. 高维随机预测的情况。在大矩阵的限制下,在对结构g进行一些假设的情况下,我们可以使用RMT的工具使这些不等式更加精确。特别是,我们将表明,我们可以使用Marˇcentko Pasturequation和自由概率理论将真实风险和已实现风险联系起来。为了简单起见,让我们假设~ NN(0,IN),(7.11),但对于任何方向与C或E无关的向量g,结果都成立,因此g被归一化为g*g=N,即g的每个分量都是有序统一的。我们强调,这些假设不一定是现实的(预测值可能会沿着C的主要成分产生偏差),但允许我们更精确地量化样本内/真实/样本外风险之间的关系。使用“坏”预测因子g后的次优回报超出了本次审查的范围。设M是一个独立于向量g的正定义矩阵,则在较大的N极限下,g*MgN=NTr[gg*M] =自由度G*gNν(M)(7.12),其中我们记得,Д是归一化跟踪运算符。因此,根据我们的假设(7.11),我们可以很容易地减少,g*MgN公司- ^1(M)→N→∞0。(7.13)现在设置M={E-1,C-1} ,我们将等式(7.13)应用于等式。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:59:09
(7.7)、(7.5)和(7.9)分别为→GNИ(E-1) ,R真→GNИ(C-1) ,路由→G^1(E-1CE-1) NИ(E-1) ,(7.14)其中,我们回顾,Д是等式(2.61)中定义的归一化跟踪运算符。让我们关注上面的前两个术语。对于q<1,我们已经在上面显示了在高维区域中,onehas^1(C-1) = (1 -q) ^1(E-1) –见等式(3.24)。因此,对于N→ ∞Rin=(1-q) 真的。(7.15)因此,对于任何q∈ (0,1),我们发现与wEalways相关的样本内风险提供了一个过于乐观的估计值。更好的是,我们能够准确量化低估的风险,这要感谢Sto(7.15)。接下来,我们想为“样本外”风险找到相同类型的关系。我们记得,在第3章的框架下,我们可能总是重写E=C1/2WC1/2,其中W是参数q的whiteWishart矩阵,独立于C。因此,对于样本外风险rout=G^1(C-1瓦-2) NИ(E-1) 当N→ ∞. 然后,技巧是注意到在大矩阵的极限中,W和C区域是无交感的。这使得我们可以从自由度关系(2.64)得出如下结论:-1瓦-2) =^1(C-1) ^1(W-2) ,(7.16)因此,使用渐近关系(3.24),我们发现:Rout=G(1-q) ^1(W-2) NИ(C-1) ,(7.17)最后,可以容易地计算出Д(W-2) 通过执行大z→ 0通过将C替换为in,对等式in(3.24)中给出的Marˇcentko牧场密度的Stieltjes变换进行扩展,即tosayД(W-2) = (1 -q)-3对于q<1。我们最终得到:Rout=Rtrue1-q、 (7.18)总之,我们得到了以下渐近关系:Rin1-q=Rtrue=(1-q) Rout,(7.19),这适用于完全一般的C。注意,在【133】中,对于C=Inan和【134】中稍后的内容,在稍微不同的上下文中也得到了类似的结果。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:59:13
因此,如果一个人用“天真”的权重wE进行投资,那么预测的风险会低估已实现的风险一个因素(1-q) 在极端情况下,N=T或q=1,样本内风险等于零,而样本外风险发散。因此,我们得出结论,正如所宣布的那样,将样本协方差矩阵E用于马科维茨优化问题可能会导致灾难性的结果。这表明,为了控制样本外风险,我们应该有一个更可靠的C估计量。7.1.3. 样本外风险最小化。在最后一节中,我们坚持认为投资组合管理中要控制的相关数量是已实现的样本外风险。从EQ中也可以清楚地看到。(7.19)使用样本估计值E是一个非常糟糕的主意,因此,很自然地会问:应该使用哪一个C来最小化样本外风险?马科维茨公式(7.4)天真地建议人们应该寻找所谓精度矩阵C的可靠估计量-但事实上,由于预期样本外风险与矩阵C呈线性关系,因此应估计矩阵X。有两种不同的方法可以证明oracle估计器确实会产生最佳的样本外风险。第一种方法是根据条件期望重新表述马科维茨问题。事实上,马科维茨问题可以被认为是在投资日观察到的预期未来风险的最小化。更正式地说,它可以写为minwE“兜售Pt+Toutt=t+1hw,rtiF(t)#,s.t.w*g级≥ G,(7.20),其中F(t)是时间t(投资数据)的所有可用信息,Toutis是样本期外,r是我们投资组合中N只股票的收益向量。假设iid返回意味着最优权重独立于r的未来实现。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:59:16
此外,我们假设P(rt)∝ P(rt | C)P(C)对于t>t,其中P(C)是人口协方差矩阵C上的(任意)先验分布。然后有:E“Toutt+ToutXt=t+1hw,rtiF(t)#,=*w,ToutXtEhrtr*t型F(t)iw+,=*w,EhCF(t)iw+。(7.21)回顾第5章的结果,我们发现,在收益率的多变量高斯假设下,E[C | F(t)]=hCiP(C | E)(见等式(5.11))。因此,使用结果公式(5.12),我们可以认为,我们在计算方差时忽略了预期回报率g,因为后者通常比波动率小。我们预计这一结果也适用于多变量学生,见第3.1.3节。我们可以得出这样的结论:oracle估计器是在特定框架中最小化样本外风险的估计器。对于我们现在将要介绍的相同结果,还有另一个可能更直接的推导。它基于关系式(7.9)。让我们在第5章和第6章中讨论的旋转不变量估值器的上下文中明确地说明这一点。让我们将RIE定义为Ξ=NXi=1ξ(λi)uiu*i、 我们回忆起我∈[[1,N]]是样本特征向量,ξ(·)是必须确定的函数。假设我们使用这个RIE构造我们的投资组合wΞ,我们假设它独立于预测向量g。同样,为了简单起见,我们假设g是一个均值和单位方差为零的高斯向量。因此,估计值(7.13)仍然有效,因此与投资组合相关的实际风险wΞ读数为N→ ∞:Rout(Ξ)=全球技术法规Ξ-1CΞ-1.TrΞ-1.. (7.22)利用Ξ的谱分解,我们可以重写分子asTrΞ-1CΞ-1.=NXi=1hui,Cuiiξ(λi)。(7.23)另一方面,可以将公式(7.22)的分母改写为TrΞ-1.=NXi=1ξ(λi)!。(7.24)将最后两个方程重新组合后,我们可以重写公式(7.22)asRout(Ξ)=GNXi=1hui,Cuiiξ(λi)NXi=1ξ(λi)!-2.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:59:24
(7.25)我们的目标是找到与样本特征值[λj]j相关的最佳收缩函数ξ(λj)∈[[1,N]],从而将样本外风险降至最低。这可以通过解决agiven j的以下一阶条件来实现:Rout(Ξ)ξ(λj)=0。(7.26)通过对(7.25)中ξ(λj)进行导数,可以得到- 2huj,Cujiξ(λj)ξ(λj)NXi=1ξ(λi)!-2+2ξ(λj)ξ(λj)NXi=1hui,Cuiiξ(λi)!NXi=1ξ(λi)!-3=0,(7.27),可以检查该解是否由ξ(λj)=huj,Cuji:=ξora精确给出。j、 (7.28)这是我们在第5章和第6章中研究的oracle估计量。请注意,这一结果已在[135]中获得,其中作者还表明,该估值器最大化了Sharperatio,即策略的预期回报除以其波动性。作为结论,在某些分布假设下,在旋转不变估计类下,最优RIE(6.5)实际上最小化了样本外风险。此外,byRout(Ξora)给出了相应的“最优”已实现风险=全球技术法规(Ξora.)-1., (7.29)我们使用了值得注意的特性,即∈ Z: Tr[(Ξora.)nC]=Tr[(Ξora.)n+1),(7.30),直接遵循通式(6.2)。7.1.4. 逆Wishart先验的最佳样本内和样本外风险。在本节中,我们将结果(7.29)专门用于C是参数κ>0的逆Wishart矩阵的情况,对应于简单线性收缩最优估计量。请注意,我们将在本节中假设没有异常值(r=0)。首先,我们通过z从公式(2.55)中推断→ 0表示Д(C-1) = -gC(0)=1+2κ,(7.31),因此我们从等式(7.14)中得出,在大N极限下:Rtrue=GN2κ1+2κ。(7.32)接下来,我们从公式(7.29)中可以看出,最佳样本外风险需要计算Д((Ξora)-1).
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:59:32
一般来说,这种归一化的计算非常复杂,但我们将证明,当C是逆Wishart时,会出现一些真正的简化。在LDL中,最终结果(其推导在本节末尾推迟)为:Д((Ξora.)-1) = -(1+2qκ)gE(-2qκ)=1+2κ(1+q(1+2κ)),(7.33),因此我们从公式(7.29)中得出=GN2κ(1+q(1+2κ)),1+2κ(1+q(1+2κ)),(7.34),从等式中可以清楚地看出。(7.34)和(7.32)对于任何κ>0:Rout(Ξora.)Rtrue=1+q2κ1+2κ(1+q(1+2κ))>1,(7.35),其中最后一个不等式只有在q=0时才变为等式,这是应该的。评估与oracle估计器相关的样本内风险也很有趣。它被定义为byRin(Ξora.)=全球技术法规(Ξora.)-1E(Ξora.)-1.NΞ((Ξora.)-1) ,(7.36),其中最具挑战性的术语是分子。如上所述,据我们所知,这一项的计算在一般情况下并非微不足道,而是利用了Ξora的特征值这一事实。如(6.24)所示,我们可以再次找到一个闭合公式。如上所述,我们将本节末尾的推导降级,结果为:^1(Ξora.)-1E(Ξora.)-1.= -(1 -z)gE(z)+zgE(z)z=-2qκ=(1+2κ)(1+2qκ)2κ(1+q(1+2κ))。(7.37)因此,通过堵塞等式。(7.37)和(7.33)转化为等式(7.36),我们得到了(Ξora.)=GN2κ(1+2qκ)(1+2κ)(1+q(1+2κ)),(7.38),因此我们用公式(7.32)推断,对于任何大于0的κ:Rin(Ξora.)Rtrue=1-q1+q(1+2κ)6 1,(7.39),其中不等式变为q=0的等式,如上所述。最后,可以很容易地从Eqs中进行检查。(7.19),(7.35)和(7.39),thatRin(Ξora.)-Rin(E)>0,Rout(Ξora.)-Rout(E)6 0,(7.40)明确表明,在高维框架中,我们确实通过使用oracle估计器而不是样本协方差矩阵来减少过度拟合。本技术部分的目的是得出结果(7.33)和(7.37)。我们从Eq开始。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:59:40
(7.33)并且我们使用当N→ ∞. C被假定为参数κ>0的逆Wishart。因此,一个人有Ξ((Ξora.)-1) =NNXi=11+αs(λi- 1) =αsNNXi=11-αsαs+λi,(7.41),使用公式(5.19),我们还得到αs=1+2qκ,和1- αsαs=2qκ。我们可以得出如下结论:Д((Ξora.)-1) ~ (1+2qκ)gE(-2qκ),(7.42),其中我们强调Stieltjes变换是解析的,因为它的参数对于任何κ>0都是非正的。这是公式(7.33)的第一个等式,该等式将归一化轨迹的计算与E的Stieltjes变换联系起来。当C是逆Wishart时,我们知道GEI是显式的,由(3.41)给出。尽管如此,等式(3.41)似乎偏离了z=-2qκ,因此在评估gE时必须小心(-2qκ)。为此,我们确定z=-2qκ+ε,ε>0,并将式(3.41)的分子展开为ε的幂,得出:gE(z)=q- zz(1+q- z) +O(ε),意味着对于ε=0,我们得到(-2qκ)=-1+2κ2κ(1+q(1+2κ))。(7.43)然后很容易从最后一个等式和等式(7.42)推导出等式(7.33)。公式(7.37)的计算有点繁琐,但与前一段的推导非常相似。事实上,使用它(Ξora)-1E(Ξora.)-1共享相同的本征基,我们有公式(6.24):Д((Ξora)-1E(Ξora.)-1) =NNXi=1λi(1+αs(λi- 1) ),(7.44),经过一些简单的操作后得出:Д((Ξora.)-1E(Ξora.)-1) =αsNNXi=1“1+αs(λi- 1)-1.- αs(1+αs(λi- 1))#. (7.45)定义z=-2qκ<0,可以使用与上述Stieltjes变换(及其相对于z的导数)相同的识别来推导公式(7.37)的第一个等式。式(3.41)的导数为:gE(z)=z(z+2qκ)“z(2κq+z)1+κ-κ(κ(q- z+1)+1)pκ(z+q- 1)- 2κz(1+2κ)!- 2(qκ+z)β(z)#,(7.46),其中β(z)由β(z)定义z(1+κ)- κ(1 - q) +qκ(z+q- 1)- 2κz(1+2κ),(7.47)是等式的分母。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:59:44
(3.41). 我们省略了进一步的细节来证明Eq的第二个等式。(7.37)依赖于泰勒展开-2qκ的精神与前一段相同。这将使Stieltjes变换及其导数正则化,并最终获得:- 2qκgE(-2qκ)=q(1+2κ)q+2(1+κ+2qκ(1+κ))2κ(1+q(1+2κ))(7.48),我们通过将最后一个方程插入式(7.37)中,得出所需结果。7.2. 简要回顾以前的清洁方案。在本节中,我们对文献中通过在将协方差矩阵用于投资组合构建之前清理协方差矩阵来规避上述“样本中”诅咒的许多尝试进行了简短的调查。即使下面考虑的大多数配方都不是最优的(在统计意义上),也有很多有趣的想法被提出来推断未知总体矩阵的统计特性。正如我们将看到的,大多数方法都是在Marˇcentko&Pastur的开创性工作之后出现的【17】。然而,我们强调,关于估计大型协方差矩阵的文献太多,因此不可能对所有可用的结果进行公正的判断。我们将只考虑RMT结果提供有趣见解的方法,并参考[28、136、92]以获取补充信息来源。我们将介绍四种不同类别的估计量。第一种是线性收缩法。第5章和第6章详细研究了该估计器,但在这里,我们重点讨论收缩强度的估计。正如我们将看到的,RMT将提供非常简单的方法来估计数据中的参数。然后,我们将介绍[27,23]中的特征值裁剪方法,其目的是将“可靠”特征值与“噪声”特征值分离。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:59:48
该方法的基本思想是我们在第3节中介绍的尖峰协方差矩阵模型,其中真实特征值包含一个有限的尖峰数和一个退化特征值≈ 1.- O(r/N),多重数为N- r、 第三种方法,我们称之为特征值替换,用于解决逆Marˇcenkopasur问题(见第3节)。粗略地说,在存在大量特征向量的情况下,可以将Marˇcenko Pastur方程离散化,并使用eithera参数方法[28]或非参数方法[32]解决反问题。最后一种方法涉及因子模型或结构化协方差估计,其中人们试图通过数据基础结构的简化模型来解释相关矩阵。这是金融和经济学中非常流行的方法,我们将看到RMT如何允许最近的一些进展。所有这些方法将在下一章中使用真实的财务数据进行测试。7.2.1. 线性收缩。我们记得线性收缩由Ξlin=αsE+(1)给出- αs)IN,α∈ [0, 1]. (7.49)如第5章所述,该估计量在高维统计中有着悠久的历史[15,16],因为它提供了一个简单的证明,即当N和T都较大时,样本估计量E是不一致的。在[16]或[130]中,可以从更面向RMT的角度,对高维状态下该估计量的性质进行非常详尽的介绍。很容易看出,Ξlins与样本估计量E具有相同的特征基,因此是一个旋转不变估计量,Ξlin=NXi=1ξlinuiu*i、 ξlin=1+αs(λi- 1) (7.50)我们已经强调,该估值器具有所有预期特征:小特征值向上移动(与样本特征值相比),而顶部特征值向下移动(见图7.2)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:59:50
如上所述,该估计值已在【16】中进行了充分研究。最值得注意的是,作者能够确定一个渐近最优公式,直接从数据中估计αs。保留第3节的符号,我们的数据集是Y=(Y,…,yT)∈ RN×Tand我们假设E[Yit]=0,E[Yit]=T-1对于所有i∈ [[1,N]]。定义:β=NTr[(E- IN)(E)-英寸)*]γ..= 最大β,TTXk=1NTr[(yky*k- E) (yky*k- E)*]!, (7.51)然后bαs=1-βγ(7.52)是高维区域αsin的一致估计量【16】。利用RMT的工具,更准确地说,利用第3节和第4节的结果,我们可以找到另一个αs的一致估计量,该估计量使用了以下事实:线性收缩隐含地假设基础相关矩阵是一个带参数κ的逆Wishart矩阵,从中可以推导出αs=(1+2qκ)-1、可以使用以下关系从数据中提取κ的值(对于q<1有效):gC(0)=(1-q) gE(0)=1+2κ。(7.53),其中最后一个等式可从(2.55)和(3.24)中推导得出。因此,我们从E-1as:κ=(1-q) Tr E-1N- 1.(7.54)然而,只有当k不是太大时,即当C与单位矩阵显著不同时,该估计才可靠(在相反的情况下,(1- q) Tr E-1.≈ N以便可以获得κ的负值)。估算κ的一个更可靠的替代方法是第4.2章中引入的“双样本”检验,见等式(4.40)和[124]。7.2.2. 特征值剪裁。该方法可能是第一个基于RMT的大型协方差矩阵估计方法。有几篇论文【22、27、23】对此进行了研究,其中以非常直观的方式使用Marˇcenko Pasturd分布来校正样本特征值。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:59:54
该方法的思想如下:所有超出经验矩阵最大期望特征值的特征值λ+=(1+√q) (在零假设范围内)被解释为信号,而其他是纯噪声(见图3.5)。另一种解释是,离群值是真实因素,而其他离群值则毫无意义。在最近的一篇论文【97】中,这一观点变得严格,因为如果我们假设C是(3.56)中定义的INA的有限秩扰动,那么E的整体特征值的参考矩阵仅对应于(各向同性)Wishart矩阵W。不同的是,对于这个特定的模型,这些体积特征值应该被视为纯噪声,而右边缘(1+√q) 可以解释为噪声和信号之间的阈值。如果有一个简单的分离信号特征值的规则,我们应该如何清除噪声?Laloux等人[27]提出了以下规则:首先对矩阵E进行对角化,并保持IGenvector不变。然后应用以下方案对样本特征值进行去噪:Ξclip=NXi=1ξciuiu*i、 ξ夹子。i=(λiifλi>(1+√q) 否则为λ,(7.55),其中λ的选择应确保TrΞclip=特雷。粗略地说,这种方法只是说明噪声特征值被缩小到一个(单一)常数,这样轨迹就得以保留。此过程称为剪裁,图7.2显示了它如何向上移动最低特征值,以避免先验异常低方差模式。尽管如此,该方法还是解决了几个不同的问题。首先,人们经常从经验上观察到,尤其是在金融数据方面,由矩阵维数和时间序列长度确定的q=N/T值与“有效”值存在显著差异,这使得人们能够最好地拟合经验光谱密度【27】。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 15:59:57
这种影响可能是由时间序列中较小的时间自相关[85、137、138]和/或整个分布中完整假设C=的不足引起的。在任何情况下,一个简单的方法是使用修正的上边缘λ+=(1+√qe ff)用于区分小麦和咖啡的阈值。[28]中提出的另一种可能性是引入一个微调参数αc∈ [0,1]使得dNαc最大特征值保持不变,而其他特征值仍由一个公共的|λ代替。很容易看出,对于αc=1,我们得到经验协方差矩阵,而对于αc=0,我们得到恒等矩阵。因此,αcP显示了马伦科牧场密度上限λ+的作用,并允许在E和中的零假设之间进行插值,就像线性收缩一样。然而,参数αcis的校准并非基于任何理论规则。0 1 2 3 4 5λi012345ξino清洁线夹(MP)图7.2。特征值剪裁(7.55)(红色普通线)对样本特征值的影响,阈值由(1)给出+√q) q=0.5,线性收缩率(7.50)(蓝色虚线),强度αs=0.5。我们看到最低特征值向上移动。关于该方法的另一个担忧是,我们从第6.3节中了解到,大型异常值的最佳估计值不是其简单的经验值λi。相反,当远离整体时,应将其向下移动七次,移动量等于-2q(在极限λi内 1). 因此,至少,这种偏移应包含在方程(7.55)的特征值剪裁方案中(相关讨论见[139])。7.2.3. 特征值替换。特征值替换法背后的主要思想也是非常直观的,相当于将样本特征值替换为相应的“真”值,这些值是通过反转Marˇcenko Pastur方程(3.9)获得的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 16:00:00
更正式地说,我们寻求真特征值集【uj】j∈[[1,N]]对于给定的一组样本特征值[λj]j,解方程(3.9)∈[1,N]。至于Igenvalues裁剪程序,这种技术可以被视为一种非线性收缩函数,并且有利于依赖于比裁剪“配方”更可靠的理论框架。然而,正如我们在第3.2.1节中所强调的那样,在实践中,反转Marˇcentko Pastur方程是相当具有挑战性的。在本节中,我们介绍了在大维度限制下实现这一目标的几种可能性。Marˋcenko Pastur方程的参数化。思考马尔岑科帕瑟逆问题的一种方法是采用贝叶斯观点(如第5章)。更具体地说,我们假设C属于旋转不变系综,因此没有关于特征向量的先验知识,并假设LSDρC(u)上的某种结构,由一个或几个数字参数化。这些参数的最佳值(以及相应的最佳bρC)通过相关ρe的最大似然法确定,该最大似然法从direct0 1 2 3 4λ00.511.5ρe(λ)数据幂律(fit)图7.3中获得。利用Marˇcenko Pastur方程(3.9),将幂律分布(3.49)拟合到2006年至2010年标准普尔指数450项最具流动性资产的样本特征值上。使用最大似然法进行试验,得出α≈ 0.3. 黑色虚线直方图表示经验光谱密度。Marˇcenko Pastur方程。一旦完成fit,替换清洗方案的读数为λi→ buisuch thatiN=Z∞buibρC(x)dx。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 16:00:05
(7.56)注意,在变换(7.56)下,我们假设C的特征值根据极限密度bρC的分位数平滑分配。作为此参数替换方法的说明,让我们考虑幂律密度(3.49)作为ρC(u)的先验值。这种人口特征值密度的概率模型被认为对金融市场是合理的,并反映了经济中部门规模的幂律分布【28140】。在这种情况下,在大尺寸的限制下,参数替换是显式的。此外,该模型中唯一参数λ的估计可以使用最大似然法,因为我们可以使用(3.50)和(3.35)精确计算ρEon R+。然后,这会产生一个参数bλ,从而产生bρCas。因此,替换程序(7.56)变为N→ ∞ 【28】:ui=-bλ+(1+bλ)rNii∈ [[1,N]]。(7.57)我们使用美国股票数据在图7.3中给出了这样一个过程。我们从这张图中得出结论,这确实是相当令人信服的,即C的特征值的幂律密度是一个合理的假设。Marˋcenko Pastur方程的离散化。有趣的是,在密度ρC的某种光滑性假设下,可以使用“准”非参数过程。该算法是由N.ElKaroui[32]提出的,他提出了一种近似形式的Marˋcenko Pastur逆问题。起点是要注意满足的每个特征值:zj=gS(zj)1.-q+qZρC(u)du1-ugS(zj), zj=λj- iηNj=1这是从公式(3.35)得出的,我们记得S是(3.32)中定义的T×T对偶矩阵。该方法的主要假设是分解态密度ρCas a Dirac质量的加权和:ρC(u)=NXk=1bwkδ(u-uk),这样Nxk=1bwk=1和bwk≥ 0, k∈ [[1,N]]。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 16:00:10
(7.58)注意,该分解仅使用ESD定义后的特征值离散性,其中每个特征值与等于N的权重相关联-1、注意到有两种不同的不确定性来源:“真实”特征值ujan及其相应的权重bwjso,因此参数化看起来极其复杂。在【32】中,作者建议确定位置【uj】j∈先验的,这样我们就剩下了权重∈[[1,N]]作为问题中唯一的未知变量。在此框架内,作者建议通过以下优化程序获得最佳权重:[bwj]j∈[[1,N]]=argmin{wi}Ni=1L(gS(zj)”1-q+qNXk=1wk1-ukgS(zj)#- zj)Nj=1受试者toNXk=1wk=1,和wk≥ 0k∈ [[1,N]],(7.59),其中L是某个损失函数,zj=λj- iη。除了我们通过加权狄拉克质量之和近似真实密度所产生的误差外,至少还有两个其他误差来源:1。近似值gE(zj)≈ N-1Tr(zjIN- E)-1.特征值的位置【uj】j∈[[1,N]]必须选择。在大N限值中,第一个近似值相当准确(见第7节)。然而,第二种更难处理,尤其是在光谱非常稀释的情况下。请注意,如果wede fine eja是我们在(7.59)中为每个λj设置的误差项,那么在范数L下,算法的一致性已在[32]中显示∞= maxj=1,。。。,Nmax(| Re(ej)|,| Im(ej)|)。一旦我们得到最佳重量∈[[1,N]],清洗程序为立即λi→ bui其中bui=最小值(x∈ R+:NXk=1bwkΘ(uk- x)≥iN)(7.60),其中我们使用了近似值Z∞xρC(u)du≈NXk=1bwkΘ(uk- x) ,其中Θ(x)表示Heaviside阶跃函数。虽然该方法得到了理论框架的支持,但结果表明,错误源为#2。以上是实践中的一个很强的局限性。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 16:00:13
最近提出的通过直接优化特征值[uj]j来反演Marˇcentko牧场方程的建议∈[1,N]]因此在[109]中提出。这种被称为QuEST的替代方法在数值上更加稳健(关于扩展的讨论和一些应用,请参见[141]和第8章)。作为结论,我们发现可以以非常普遍的方式(近似)求解逆Marˇcenko Pasturequation,这意味着我们可能确实能够找到所有i=1,…,的真实特征值bu的估计值,N、 因此,特征值替换估计器为Ξsub=NXk=1bukuku*k、 (7.61)然而,即使真实密度ρCis的完美估计是可行的,我们发现该估计没有考虑到样本特征向量不是真实特征向量的一致估计,如第4章所示。因此,对于协方差矩阵估计,不建议使用替代(7.61),因为这不是最佳解决方案。然而,它可用于计算最佳RIE(6.5),我们参考第8.1.3节了解更多详细信息。7.3. 因子模型。线性因子模型背后的主要思想非常简单:(归一化)数据Yitis表示为M个公因子FYit=MXk=1βikfkt+εit(7.62)的线性组合,其中βika表示变量i对因子k=1的线性暴露,时间t时的M和N×t矩阵ε是Yit的特殊部分(或统计残差),假设为零均值。矩阵形式的模型(7.62)readsY=βF+E,(7.63),称为广义线性模型【142】。通常假设残差是i.i.d.和t固定的i.i.d.(参见例如[143]中的金融应用)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 16:00:16
不难看出,模型(7.62)下的方差矩阵由c=β∑Fβ给出*+ ∑ε(7.64),其中∑Fis是因子F的大小为M×M的协方差矩阵,可以在不丧失一般性的情况下选择与单位矩阵成比例的协方差矩阵,∑ε是残差ε的N×N协方差矩阵,这是最简单框架中的单位。在lineardecomposition(7.62)中,我们可以看到,我们通常有许多参数来估计大小为O(NT)的数据集中的orderO(NM)。因此,我们看到维度的诅咒随着M的消失而消失 N、 这意味着经验估计=T(βF+E)(βF+E)*, (7.65)变得更加准确。这是清理因子模型内高维协方差矩阵的一种简单方法。然而,这种清洁方案留下了至少一个实际使用的问题。应如何选择因子M的数目?在有关于因子f的先验信息的情况下,我们只剩下β和E的估计。但在一般情况下,这个问题仍然是一个开放的问题。让我们来处理一般情况,在这种情况下,几位作者考虑使用RMTto中的工具来选择因子M的数量。在[144]中,作者假设∑ε的经验估计量由各向同性Wishartmatrix给出,其谱的上界是精确已知的。因此,如果数据中存在显著因素,应注意(7.65)中定义的矩阵的最大特征值不能超过λE ff+(q):=(1+√q) +δ(q,N)(7.66),其中最后一项δ是一个适当定义的常数,以反映Tracy Widom尾巴的宽度,即δ(q,N)~ N-2/3[144]. 然而,如果观察到最大样本特征值λ超过λe ff+,则可能存在真实因子。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 16:00:20
在这种情况下,【144】中建议的程序是从数据中提取相应的最大分量:Y(1)it=Yit- β1tf1t,是第一主成分数据回归的残差。接下来,我们比较Y(1)Y(1)的最大特征值*/T相对于新阈值λe fff+(q=q- 1/T)并删除程序,直到Y(M)Y(M)*/T的所有特征值都位于马伦科Pastur海。在[145]中,这种方法被推广到∑ε的经验估计量是各向异性Wishart矩阵的情况,对于该矩阵,有几个关于谱的结果(见第3章)。该过程与上述过程类似:作者利用参考文献[146]的结果,提出了一种检测各向异性Wishart矩阵的Toutliers的算法。有关更多详细信息,请参阅[145]。因此,我们可以看到RMT允许我们推导一些基于严格的启发式方法来确定真实因子M的数量,这在精神上与上述特征值裁剪方法非常相似。也有可能对相关因素的结构有一些先验见解。例如,这是理论金融中的一种标准有效状态,所谓的资本资产定价模型(CapitalAsset Pricing Model,CAPM)[147]假设一个唯一的因素对应于市场投资组合,或Fama French[148]对其三因素模型的扩展(更多新扩展请参见[149])。在这种情况下,可以通过假设因子fk和残差εi线性不相关,将问题简化为β的估计:hfkfli=δkl,hεiεji=δij1-Xlβli!和hfkεli=0,(7.67),这样真正的相关性变成:Cij=MXk=1βkiβkj+δij1-MXl=1βli!也就是说,如果i=j(ββ*)i否则。(7.68)我们再次强调,我们被简化为只估计N×t点中的N×M参数。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 16:00:24
我们现在深入了解了如何使用样本数据估计β的系数,这是由于最近的论文[150]。注意,特征值剪裁(7.68)可以通过设置β来恢复≡ βP CA其中βP CA..=U | M∧1/2 | M,(7.69),U为样本特征向量,N×N对角矩阵为样本特征值,下标| M表示仅保留M个最大分量,其中M为λi>(1+√q) 对于任何i≤ M、 [150]中的方法建议确定βs,以便:bβ..=argminβLTYY公司*- ββ*OFF-诊断!,(7.70)用L表示给定的损失函数,“o fff-diag”表示o fff-diag元素。(对角线元素在构造上都等于一)。在数值上,作者在PCAβ(7.69)附近用二次范数L求解后一个方程。我们请读者参阅[150],以了解程序及其实现的更多细节,以及模型的非线性(波动性)依赖关系的扩展。8、数值实施和实证结果本章旨在将上述所有想法在金融环境中付诸实践,最终目标是实现样本外风险或前瞻性风险最小化。如上所述,旋转不变估计框架在这方面很有前景。尽管如此,当人们试图用数值方法实现这种方法时,还是会出现一些问题。例如,我们在第6.5节中看到,最优RIE(6.5)的离散版本(6.26)系统地偏离其小特征值的极限值。但正如我们在第7节中所讨论的,这些小特征值的估计尤其重要,因为马科维茨最优投资组合往往会使它们超重,因此,这些小特征值的估计不足可能会导致灾难性的结果。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 16:00:27
因此,我们将首先讨论最近文献中出现的两种不同的正则化方案(见[141]和[151]),它们试图纠正小特征值的系统性低估。然后,我们将转向对合成和真实金融数据的数值实验,并测试用于真实世界应用的正则化RIE的质量。8.1. 最优RIE(6.26)的有限N正则化。8.1.1. 为什么小特征值会有问题?。使用样本协方差矩阵上的零假设可以最好地说明小的特征值偏差。事实上,我们知道,对于C=IN,最佳RIE(6.5)应与N一样精确地屈服于bξ(λi)=1→ ∞ (见等式(6.21))。因此,我们将有限N的可观测收缩函数bξN(6.26)与其极限值bξ=1进行了比较。结果如图8.1所示,其中可观测估计器等式(6.26)显示为绿点,而极限值由红色虚线给出。我们看到,整体和右边缘的估计相对较好,但左边缘的情况显然不是这样,在左边缘以下的估计值下降到零,而不是保持接近统一。正如【38】或【111】所述,这突出表明,与光谱的其他部分相比,小特征值的行为更难处理。这种低估可以通过分析进行研究。z=λ- iη,我们实际上从图8.1中看到,离散RIEbξ是极限量bξ(z)的一个非常好的近似值,即η=N-1/2(蓝色普通线)。因此,左边缘的偏差对于任何有限的N都是系统性的,并且仅在N时消失→ ∞ (η → 0+). 这种有限尺寸效应是由于硬左边缘,特征值被定义为保持在R+。让我们举例说明一下:在一次切割假设下,我们总是可以将Stieltjes变换分解为(参见等式。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 16:00:31
(2.31))gE(z)=h(z)+Q(z)pd+(z)pd-(z) ,d±(z)…=z-λ±(8.1),其中h(z)是ρean的希尔伯特变换,Q(z)是一个给定的函数,我们假设它在C+上是光滑的。我们将自己置于d-(λ) = ε  η、 即特征值λ非常接近于零。那么,我们有ge(z)=h(z)+Q(z)p-iηpd+(λ)-iη+O(ε)=h(z)- (1+i)Q(z)rη| d+(λ)|+O(ε)。(8.2)将最后一个方程专门化为零假设C=IN,从等式(2.41)可以推断出1/Q(z)=2qz,h(z)=Q(z)(z+Q-1). 然后将(8.2)插入(6.5)中,在左边缘产生:bξ(λ-- iη)=1-s2η√q(1-√q) +O(η),(8.3)0.0 0.5 1.0 1.5 2.0 2.5 3.0λi0.40.50.60.70.80.91.01.11.2ξi经验限制(η=N-1/2)极限(η→ 0)图8.1。C=in,N=500的经验RIE(6.26)(绿点)评估。矩阵x使用Wishart矩阵生成,参数q=0.5。我们将结果与η=N的极限值进行比较-1/2(蓝线)和η→ 0+(红色虚线)。也就是说,对N阶的渐近结果bξ(z)=1有一个有限大小的“修正”-η=N时为1/4-1/2. 因此,如果N不够大,则该修正非常重要。一个诱人的解决方案是将η的值减小到任意小。然而,我们知道,经验Stieltjes变换只是极限值的一个很好的近似值,直到阶数误差(Tη)-1,因此η也不能太小[111]。我们得出结论,我们在图8.1和6.5中观察到的低估效应纯粹是由于有限尺寸效应,并且对于ρC的任何模型都会进一步发生(见图6.5)。我们强调,这种影响不同于影响左侧异常值的相位转换,如图6.4.8.1.2所示。规范化经验RIE(6.26)。有两种方法可以解决这个问题。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 16:00:34
第一种方法是使用一个简单的特别去噪程序,我们现在将对此进行解释;第二个是Ledoit和Wolf最近提出的更加复杂的方案(见下文)。首先,利用有限尺寸修正对大特征值无害的事实(见图8.1),我们可以只关注小样本特征值。我们的想法是使用一种正则化,如果真实的相关矩阵是逆Wishart类型,则该正则化将是精确的,ρCto由公式(2.53)给出,我们知道相关的最佳RIE是线性收缩(6.24)。在该规范中,参数κ允许在整体范围内插值ρcB。【151】中提出的一个更简单的解决方案是考虑重新缩放的Marˇcentko Pastur谱,以确定最小的特征值λN。当κ足够大时,这与IW程序无法区分,并为美国股票回报提供非常准确的预测【151】。然而,如果存在非常小的“真实”特征值,对应于非常强的相关金融合同对,那么这个简单的方法就失败了。测量R+(κ→ 0+和零假设(κ→ ∞).我们的程序仅用于正则化,即校准κ,使下边缘λiw-相应的经验谱(和式(3.41)中给出的)与观测到的最小特征值λN一致。然后,我们使用精确因子重新缩放最小特征值,如果C确实是逆Wishart矩阵,则需要该因子,即:bξregi=bξNi×max(1,Γiwi),Γiwi=| 1-q+qzigiwE(zi)|λi/(1+αs(λi- 1) ),zi=λi- 在里面-1/2,(8.4),其中αs=1/(1+2qκ),giwEis在等式(3.41)中给出。我们在算法1中给出了这种“IW正则化”的更精确实现,并对参数k=10和q=0.5的逆Wishartmatrix(2.58)进行了数值说明,其中αs≈ 0.09.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 16:00:43
结果如图8.2所示,其中经验点来自N=500的单个模拟。算法1经验RIE(6.26)函数g IW(z,q,κ)的IW正则化:λ±←(1+q)κ+1±p(2κ+1)(2qκ+1)/κ;回来z(1+κ)- κ(1 - q)-pz公司-λ+pz-λ-/(z(z+2qκ));end function函数rie(z,q,g):返回Re[z]/| 1- q+qzg |;结束函数函数去噪rie(N,q,{λi}Ni=1)://λ>λ>…>λNκ← 2λN/(1 -q- λN)- 4qλN;α ← 1/(1+2qκ);对于i=1到N doz← λi- 在里面-1/2;g级←PNj6=i1/(z)-λj)/(N)- 1);^ξi← rie(z,q,g);g级← g iw(z,q,κ)Γi← (1+α(λi- 1) )/rie(z,q,g);如果Γi>1且λi<1,则^ξi← Γi^ξi;结束ifend fors←Piλi/Pi^ξi//保留tracereturn{s×^ξi}Ni=1结束函数,我们现在重新考虑第6.5节中给出的数值示例,我们对其应用IW正则化算法(1)。结果如图8.3所示,我们观察到IW0.0 0.5 1.0 1.5 2.0 2.5 3.0λi0.40.50.60.70.80.91.01.11.21.3ξIEmpilicalacleregulated(MP)regulated(IW)如图8.2所示。我们应用z=λ的IW正则化bξregi- 在里面-1/2在C是κ=10且q=0.5的逆Shart矩阵的情况下。有效校正了经验RIE(6.26)(绿点)的有限尺寸效应。红色点对应于Oracle估计器,在本例中,这是linearshrinkage过程。我们还比较了[151]中提出的“重新定标”马伦科牧场光谱的结果。正则化对于我们在模拟中考虑的所有四个总体特征值都非常有效。事实上,如果我们观察左边缘区域,正则化特征值已上移,以与Oracle估计值(蓝点)一致,而我们观察到经验裸估计值(绿点)存在显著差异。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-15 16:00:46
因此,IW正则化(算法1)提供了非常简单的方法来纠正这种系统的下行偏差,这在我们需要反转协方差矩阵时至关重要。注意,我们可以通过对正则特征值进行排序来进一步改进结果。这一点可以通过以下事实得到证明,即我们期望RIE对于极限N内的样本特征值是单调的→ ∞. 我们将在下一节中对这一点进行数值研究(见表1)。8.1.3. 量化特征值采样变换(QuEST)。Ledoit和Wolf最近提出的另一种方法是用Marˇcentko Pastur方程(3.9)来计算最佳RIE(6.5),该方法是数值近似的。这与byN提出的数值格式有些相似。El Karoui(见第7.2.3节)来解决Marˇcentko Pastur方程的间接问题。该方法名为QuEST(量化特征值采样变换),基于特征值的量化表示。更正式地说,关键假设是经验特征值根据光谱分布的分位数进行平滑分配,即iN=Zλi-∞ρE(x)dx,(8.5),目的是找到分位数,作为总体特征值[ui]i的函数∈[[1,N]],如(8.5)所述。请注意,表示法(8.5)是对体特征值的经典位置的定义,如公式(3.40)所示。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群