全部版块 我的主页
论坛 经济学人 二区 外文文献专区
898 11
2022-05-26
英文标题:
《Optimal Shrinkage Estimator for High-Dimensional Mean Vector》
---
作者:
Taras Bodnar, Ostap Okhrin, Nestor Parolya
---
最新提交年份:
2018
---
英文摘要:
  In this paper we derive the optimal linear shrinkage estimator for the high-dimensional mean vector using random matrix theory. The results are obtained under the assumption that both the dimension $p$ and the sample size $n$ tend to infinity in such a way that $p/n \\to c\\in(0,\\infty)$. Under weak conditions imposed on the underlying data generating mechanism, we find the asymptotic equivalents to the optimal shrinkage intensities and estimate them consistently. The proposed nonparametric estimator for the high-dimensional mean vector has a simple structure and is proven to minimize asymptotically, with probability $1$, the quadratic loss when $c\\in(0,1)$. When $c\\in(1, \\infty)$ we modify the estimator by using a feasible estimator for the precision covariance matrix. To this end, an exhaustive simulation study and an application to real data are provided where the proposed estimator is compared with known benchmarks from the literature. It turns out that the existing estimators of the mean vector, including the new proposal, converge to the sample mean vector when the true mean vector has an unbounded Euclidean norm.
---
中文摘要:
本文利用随机矩阵理论推导了高维均值向量的最优线性收缩估计。结果是在假设维度$p$和样本量$n$都趋于无穷大的情况下得到的,这样一来,$p/n到c在(0,infty)$。在对底层数据生成机制施加弱条件的情况下,我们找到了最优收缩强度的渐近等价物,并一致地估计了它们。本文提出的高维均值向量的非参数估计具有简单的结构,并且在概率为$1$的情况下,证明了当$c在(0,1)$时,该估计可以渐近地最小化二次损失。当(1,infty)$中的$c时,我们通过使用精度协方差矩阵的可行估计来修改估计量。为此,本文进行了详尽的模拟研究,并将所提出的估计量与文献中的已知基准进行了比较。结果表明,当真平均向量具有无界欧氏范数时,现有的平均向量估计量(包括新建议)收敛到样本平均向量。
---
分类信息:

一级分类:Mathematics        数学
二级分类:Statistics Theory        统计理论
分类描述:Applied, computational and theoretical statistics: e.g. statistical inference, regression, time series, multivariate analysis, data analysis, Markov chain Monte Carlo, design of experiments, case studies
应用统计、计算统计和理论统计:例如统计推断、回归、时间序列、多元分析、数据分析、马尔可夫链蒙特卡罗、实验设计、案例研究
--
一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--
一级分类:Statistics        统计学
二级分类:Statistics Theory        统计理论
分类描述:stat.TH is an alias for math.ST. Asymptotics, Bayesian Inference, Decision Theory, Estimation, Foundations, Inference, Testing.
Stat.Th是Math.St的别名。渐近,贝叶斯推论,决策理论,估计,基础,推论,检验。
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-5-26 21:41:44
他们提出了所谓的正部分型James-Stein估计量,并通过模拟表明它支配着高维James-Stein估计量*相应的authorEmail地址:taras。bodnar@math.su.se(Taras Bodnar)预印本提交给J.Multivariate Anal。2018年7月17日不变损失下的估计量。Wang等人[45]通过最小化预期的二次损失,考虑了单位向量的最优收缩估计量。然而,他们的估计量在大维度上需要计算,因为它涉及非平凡和。然后,他们建议在实践中使用估计量的极限形式。本文通过使用随机矩阵理论推导最优收缩估计量(针对任何固定目标),为位置参数估计的文献做出贡献。新的估计数依赖于比常用的假设更弱的假设。我们证明了它的渐近正态性,推导了它的极限行为,并通过仿真表明,它在二次损失函数和计算时间方面都优于基准方法。本文的结构如下。第2节介绍了均值向量的最优收缩估计量,其中证明了其渐近等价于非随机量且在极限处为高斯。在第3节中,我们提供了一个可靠的估计量,并研究了它的渐近行为。第4节讨论了模拟研究中使用的基准程序,其结果在第5节中报告。财务应用见第6节,结论见第7节。技术推导被归入附录。2、均值向量的最优收缩估计在这一节中,我们构造了大维渐近下均值向量的最优收缩估计。设yn是在时间点1,…,观察到的p维随机向量的p×n矩阵,n
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-26 21:41:47
yn每列的平均向量用un表示,而∑nstands表示其协方差矩阵。在大维渐近范式下,维度p和样本量n都趋于一致,p/n→ c∈ (0,∞) asn公司→ ∞. 因此,在不丧失普遍性的情况下,很自然地假设p≡ p(n)是n的函数。随后,我们假设观测矩阵在分布上等于ynd=∑1/2nXn+un>n,(1)其中p×n矩阵xn包含具有零均值和单位方差的iid随机变量,而1nis是1s的n维向量。只有矩阵yn是可见的。Xnnor∑nw和unar均未知。必须注意的是,观测矩阵yn有依赖行,但有独立列。通过控制依赖项数量的增长,可以进一步将施加在其列上的独立假设减弱为XNB的依赖元素,而它们的联合分布可以是任意的;见【29】。因此,独立性假设仅在下文中用于技术方便。接下来,我们提出了本文中使用的主要假设。(A1)存在λ>0,使得λ≤ λmin(∑n)在p上一致,其中λmin(A)表示方阵A的最小特征值。类似地,A的最大特征值由λmax(A)表示。(A2)存在常数γ>0,M`>0,Mu>0,使得limp→∞p-γ| |un | |=M `和跛行→∞p-γ| |u| |=Mwith0<M`≤ M、 M级`≤ Mu<∞. 这里,u表示目标平均向量。(A3)对于某些ε>0,矩阵元素Xnhave一致有界2+ε矩。所有这些规律性假设都是非常普遍的,并且适用于许多实际情况。假设(A1)控制总体协方差矩阵最小特征值的行为。值得注意的是,没有对∑n的最大特征值施加任何条件,随着p变大,最大特征值也可能增加到完整性。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-26 21:41:51
这尤其允许我们将结果应用于高维因子模型,这在经济学和金融学中非常流行;例如,参见[4、5、12、17、23、24、25]。通过对真协方差矩阵∑nlike锥化的结构假设,避免了∑ncan最小特征值下界的假设;见【16】。本文假设所有特征值都是严格正的。未知平均向量u和目标向量u的范数增加通过假设(A2)进行监控,假设(A2)只要求它们具有相同的顺序。最后,假设(A3)是技术性的,在某些情况下可以放宽;参见【39】。平均向量unis的一般线性收缩估计量由uGS E=αn'yn+βnu给出,(2),其中'yn=n-1样本平均向量的ynnstands。目标向量u也可以是随机的,但与实际信息集Yn无关。目的是找到最佳收缩强度,以最小化给定目标向量u的二次损失,表示为l=| |∑-1/2n(uGS E)- un)| |=(uGS E- un)>∑-1n(uGS E)- un)。(2)的应用导致以下优化问题:minαn,βnαn'y>n∑-1n'yn+βnu>∑-1nu+2αnβn'y>n∑-1nu- 2αn'y>n∑-1nun- 2βnu>n∑-1nu。取L对α和β的导数,将它们设为零,我们得到αnL=αn'y>n∑-1n’yn+βn’y>n∑-1nu-\'y>n∑-1nun=0,βnL=βnu>∑-1nu+αn'y>n∑-1nu- u>n∑-1nu=0。L的Hessian由H给出=\'y>n∑-1n’yn’y>n∑-1nu′y>n∑-1nu>∑-1nu,这是一个概率为1的正定义矩阵,因为y>n∑-1n?yn>0,概率为1,det(H)=?y>n∑-1n?ynu>∑-1nu- (\'y>n∑)-1nu)>0(3),概率为1,应用于向量的Cauchy–Schwarz不等式∑-1/2n'ynand∑-1/2nu。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-26 21:41:54
因此,最佳收缩强度由α给出*n=α*n(\'yn,∑n,un,u)=\'y>n∑-1nunu>∑-1nu- u>n∑-1nu′y>n∑-1nu′y>n∑-1n?ynu>∑-1nu- (\'y>n∑)-1nu),β*n=β*n(\'yn,∑n,un,u)=\'y>n∑-1n?ynu>n∑-1nu-\'y>n∑-1nu′y>n∑-1nun'y>n∑-1n?ynu>∑-1nu- (\'y>n∑)-1nu)。在定理1中,我们证明了最佳收缩强度α*nandβ*nare几乎肯定渐近等价于非随机量α*和β*在大维渐近p/n下→ c∈ (0,∞) 作为n→ ∞.定理1。假设(A1)–(A3)保持不变。然后|α*n- α*|a、 s。→ 0和|β*n- β*|a、 s。→ 0表示p/n→ c>0为n→ ∞, 其中α*= α*(σn,un,u)=u>n∑-1nunu>∑-1nu- (u>n∑)-1nu)(c+u>n∑-1nun)u>∑-1nu- (u>n∑)-1nu),(4)β*= β*(∑n,un,u)=(1- α*)u>n∑-1nu>∑-1nu。(5) 注意α*∈ (0,1)由于不等式(3)。此外,利用定理1的结果,我们可以估计α*和β*至少对于c一致∈ (0,1),如下面的定理3所示。值得注意的是,提议的程序与Wang等人[45]提出的程序非常不同,Wang等人将预期的二次损失和估计的最佳收缩强度降至最低。虽然他们找到了概率收敛的最优收缩强度的估计量,但我们的目标是构造几乎肯定收敛的一致估计量。值得指出的是以下几点。备注1。具有相同γs的技术假设(A2)是关键。如果该条件失效,即存在γ和γ,使得跛行→∞p-γ| |un | |=M `和跛行→∞p-γ| |u| |=Mw,0<M`≤ M、 M级`≤ Mu<∞, 然后从β的表达*分子的速率为γ+(γ+γ)/2,而分母的速率为γ+γ。因此,如果γ,γ,那么β*不适用。s→0表示n-1便士→ c>0为n→ ∞ 如果γ<γ,∞ 对于n-1便士→ c>0为n→ ∞ 如果γ>γ。设c=p-γc,qi j=p-γu>i∑-1nuj,对于i,j∈ {0,n}和d=qqnn- q0n。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-26 21:41:58
在定理2中,我们证明了α*nandβ*nare在大维渐近区域下渐近高斯。必须注意的是,正规化假设仅用于定理2和4,而第二(四)矩的存在仅用于我们的其余结果。定理2。假设(A1)–(A2),并让Xnbe标准的元素正态分布。然后√pγnσ-1α(α*n- α*)   N(0,1),√pγnσ-1β(β*n- β*)   N(0,1),对于p/N→ c>0为n→ ∞, 其中σα={(▄cq- d) qd+~cdq}(~cq+d)-4和σβ=(~cq+d){(d)- cq)q0nqnn+(cq0n)- cd- dqnn)q+~cdq0n+2(~cq0n)- cd- dqnn)(d- cq)q0n}。3、Bonafide估值器本节给出了α的一致估值器*和β*, i、 e.,对于最优收缩估计量α的确定等效量*nandβ*n、 我们用^α表示*和^β*. 该程序允许我们构建未知收缩强度的可靠估计量。利用随机矩阵理论的最新结果,我们进一步证明了^α*和^β*一致且渐近正态分布。LetSn=n-1(Yn-\'\'yn>n)(yn-(R)yn>n)>=n-1YnY>n-“yn”y>nbe样本协方差矩阵。在下面的定理3中,我们给出了α的一致估计*和β*在大维渐近下。定理3。假设(A1)–(A2),并让XnPosses的元素一致有界于ε>0的4+ε矩。α的一致估计*和β*由^α给出*= ^α*(\'yn,Sn,u)={y>nS-1n英寸- p/(n)- p) }u>S-1nu- ((R)y>nS-1nu)(R)y>nS-1n?ynu>S-1nu- ((R)y>nS-1nu),(6)^β*=^β*((R)yn,Sn,u)=(1- ^α*)y>nS-1nu>S-1nu。(7) 其次,我们证明了收缩强度的一致估计是渐近正态分布的。这一结果是在附加条件下研究的,附加条件是Xn的条目分布,其被假定为标准正态分布。定理4。假设(A1)–(A2),并让Xnbe标准的元素正态分布。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群