全部版块 我的主页
论坛 经济学人 二区 外文文献专区
817 17
2022-06-28
英文标题:
《Random matrix approach to estimation of high-dimensional factor models》
---
作者:
Joongyeub Yeo, George Papanicolaou
---
最新提交年份:
2017
---
英文摘要:
  In dealing with high-dimensional data sets, factor models are often useful for dimension reduction. The estimation of factor models has been actively studied in various fields. In the first part of this paper, we present a new approach to estimate high-dimensional factor models, using the empirical spectral density of residuals. The spectrum of covariance matrices from financial data typically exhibits two characteristic aspects: a few spikes and bulk. The former represent factors that mainly drive the features and the latter arises from idiosyncratic noise. Motivated by these two aspects, we consider a minimum distance between two spectrums; one from a covariance structure model and the other from real residuals of financial data that are obtained by subtracting principal components. Our method simultaneously provides estimators of the number of factors and information about correlation structures in residuals. Using free random variable techniques, the proposed algorithm can be implemented and controlled effectively. Monte Carlo simulations confirm that our method is robust to noise or the presence of weak factors. Furthermore, the application to financial time-series shows that our estimators capture essential aspects of market dynamics.
---
中文摘要:
在处理高维数据集时,因子模型通常有助于降维。因子模型的估计在各个领域都得到了积极的研究。在本文的第一部分中,我们提出了一种利用残差的经验谱密度估计高维因子模型的新方法。金融数据协方差矩阵的频谱通常表现出两个特征方面:少量峰值和大量。前者代表主要驱动特征的因素,后者则来自于特殊噪声。出于这两个方面的考虑,我们考虑了两个光谱之间的最小距离;一个来自协方差结构模型,另一个来自通过减去主成分获得的金融数据的实际残差。我们的方法同时提供了因子数量的估计量和残差中相关结构的信息。利用自由随机变量技术,该算法可以有效地实现和控制。蒙特卡罗模拟证实,我们的方法对噪声或弱因素的存在具有鲁棒性。此外,对金融时间序列的应用表明,我们的估计量捕捉到了市场动态的基本方面。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--
一级分类:Physics        物理学
二级分类:Data Analysis, Statistics and Probability        数据分析、统计与概率
分类描述:Methods, software and hardware for physics data analysis: data processing and storage; measurement methodology; statistical and mathematical aspects such as parametrization and uncertainties.
物理数据分析的方法、软硬件:数据处理与存储;测量方法;统计和数学方面,如参数化和不确定性。
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-6-28 09:31:14
高维因子模型的估计在统计学和计量经济学中得到了广泛的研究[1、3、4、10、11、12、21、22、30、38]。本文提供了一种利用残差的奇异值分布估计高维因子模型的新方法。根据最小距离法,我们估计*uriyeobi@gmail.com,斯坦福大学计算与数学工程研究所,斯坦福,加利福尼亚州94305,美国+papanico@math.stanford.edu,斯坦福大学数学系,斯坦福,加利福尼亚州94305,USAof因子和残差的相关结构。通过Montecarlo仿真验证了该方法的有效性,在我们考虑的大多数情况下,该方法的性能优于其他已知方法。此外,财务数据的结果表明,我们的估计员有效地捕捉到了结构性市场变化。考虑如下因素模型。对于i=1、····、N和t=1、····、t,Rit=pXj=1LijFjt+Uit(1),其中riti是时间t时第i个单位的数据(如资产回报),Ftjis是时间t时的第j个系数,li是第j个系数对第i个横截面单位的负荷。UIT是Rit的特质成分或剩余量。通常,只有R是可见的。因此,以下问题是可能的:1。如何估计F(因子)和L(因子载荷)?2、如何估计p(因子数)?3、U=R- LF。U(残差)的性质是什么?它们是噪音还是仍然包含信息?对于第一个问题,给定p,主成分可用于估计F和L。对于第二个和第三个问题,一种方法是通过查看R的协方差矩阵的奇异值来确定p,并根据给定的方差解释阈值取其中一些值。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-28 09:31:21
前者依赖于ANand BT的建模,但我们假设一个简约的矩阵结构,仅由一个小参数集(θAN,θBT)决定。这不是最通用的模型,因为互协方差和自协方差的贡献是解耦的:cov(Uit,Ujs)=ANijBTts。我们假设每个时间序列Uit(t=1,···,t)是归一化的,并且具有单位方差。我们搜索因子数(p)和参数集(θAN,θBT),以使模型和实际数据之间的光谱距离最小化。这种基于频谱的方法由真实数据频谱中的两个典型特征方面驱动:少量峰值和大量。前者代表主要驱动市场特征的因素,后者则来自于特质噪音。这也是由[43]的结果在理论上推动的,该结果分析了在某些假设下,CNT的经验特征值分布收敛到合适的极限分布。因子模型估计问题说明如下。{p,θ}=arg minp,θDρ实(p),ρ模型(θ)(2) 其中ρreal(p)是通过从原始数据中去除p个主成分构建的残差协方差矩阵的经验特征值密度,ρmodel(θ)是以参数集θ=(θan,θBT)为特征的一般协方差矩阵的极限特征值密度,d是我们选择的谱距离度量或损失函数。该最小化问题的解给出了残差相关结构的因子数和参数。至于估计因素的数量,在以前的文献中提出了几种方法【1、4、21、22、30】。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-28 09:31:24
与其他估计器的主要区别在于,我们的方法找到了整个光谱分布的最佳拟合,这使我们能够同时考虑峰值和大部分分布。ρ模型(θ)的计算存在困难,因为在一般情况下使用Tieltjes变换中的极限分布非常复杂。然而,[9]最近的一项工作使用自由随机变量技术提供了极限光谱密度的解析推导。本文利用这些结果计算ρ模型(·)。此外,我们提出了一个简单的估计问题,该问题考虑了ANA和BT的简约矩阵结构。特别是,假设互相关被因子有效去除,我们假设归一化残差之间的互相关可以忽略不计:一个≈ IN×N(或上例中的β=0)。但我们仍然假设它们是连续相关的,与时滞相关的指数衰减:(BT)ij=b | i-j |。然后将ρ模型(θAN,θBT)替换为ρ模型(b),最小化问题只有两个标量变量p和b。这种简约模型有两种意义。首先,它有利于可计算性,因为我们采用了自由随机变量技术。其次,参数b表示残差均值回归的整体速率。残差的均值回归特性在当前金融市场中越来越受到关注,尤其是在统计套利策略中[42]。我们工作的第二个主要贡献是,通过使用已知模型生成的合成数据进行测试,验证了所提出的方法。用合成数据进行的蒙特卡罗模拟表明,估计量的有限样本性能良好。对于N和T的各种选择,因子数量和自回归参数都得到了准确估计。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-28 09:31:27
我们将我们的方法估计的因子数与文献中其他方法估计的因子数进行了比较,结果表明我们的方法对噪声具有鲁棒性,并且在识别弱因子方面表现良好。第三个贡献是,我们发现,利用真实的市场时间序列数据,我们对简化问题的估计成功地捕捉到了市场动态。我们提出的估计问题是静态的,因此为了观察参数的时变行为,我们使用移动窗口重复估计过程。对于市场数据,我们使用2000-2015年期间标准普尔500指数股票的日收益率。我们计算估计量的时间变化。结果表明,估值器反映了市场的制度变迁信息。特别是,我们发现,在应力期间,ρreal(p)可以通过数据轻松获得。详情见第4.1节周期,因子数量正在减少,而相应因子解释的方差增加,这表明市场凝结。此外,由估计的自回归系数b表示的残差的全局平均回归时间非常接近于波动率指数。我们还发现,在危机期间,残差更具趋势性,平均值回复速度较慢。论文的其余部分包括以下内容。在第二节中,我们回顾了相关文献。在第3节中,我们考虑一个激励示例。第4节描述了我们对因子模型的估计方法,并描述了使用的程序。第5节包含蒙特卡罗分析以及与其他方法的比较。第6节展示了具有真实数据的应用程序。我们在第7.2节相关文献中得出结论,我们在高维环境中的方法基本上基于随机矩阵理论。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-28 09:31:30
Randommatrix理论最初是为了研究复杂量子系统中的相互作用而发展起来的【41】,可以用来识别偏离普遍预测的非随机性质。【24】和【33】是将随机矩阵理论应用于金融相关性的前两项研究,物理学界也有无数论文紧随其后【13、29、34、35、37】。[6]和[7]提供了关于随机矩阵理论财务应用的综合观点。他们从股票收益率分析了经验互相关矩阵的特征值分布。他们的目标是偏离理论预期的特征值,即马尔琴科-Pastur定律[26],提供真实的市场信息,如市场模式或工业部门。然后通过计算这些偏离特征值来确定因子的数目。然而,在散装区域,“无信息”或“纯噪声”假设过于严格,在实践中证明是无效的。如第3节中的示例所示,协方差矩阵的经验谱密度从实际剩余收益到马尔琴科牧场分布的拟合存在问题。这意味着真实数据的残差不一定是纯噪声,需要考虑更一般的相关结构来评估经验密度。【43】的惊人工作为我们的估计方法提供了核心理论基础。作者考虑了形式为CN=TA1/2N的一般协方差矩阵CN英国电信TA1/2N,其中An和Bt分别是大小为N×N和T×T的非负有限矩阵,以及 具有i.i.d.条目的isan N×T高斯随机矩阵。设c=不适用。[43]表明,在某些假设下,Cn的经验特征值分布弱收敛于非随机分布Fc,a,B。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群