高维因子模型估计的随机矩阵方法

880

收藏 2022-06-28

英文标题：
《Random matrix approach to estimation of high-dimensional factor models》
---
作者：
Joongyeub Yeo, George Papanicolaou
---
最新提交年份：
2017
---
英文摘要：
In dealing with high-dimensional data sets, factor models are often useful for dimension reduction. The estimation of factor models has been actively studied in various fields. In the first part of this paper, we present a new approach to estimate high-dimensional factor models, using the empirical spectral density of residuals. The spectrum of covariance matrices from financial data typically exhibits two characteristic aspects: a few spikes and bulk. The former represent factors that mainly drive the features and the latter arises from idiosyncratic noise. Motivated by these two aspects, we consider a minimum distance between two spectrums; one from a covariance structure model and the other from real residuals of financial data that are obtained by subtracting principal components. Our method simultaneously provides estimators of the number of factors and information about correlation structures in residuals. Using free random variable techniques, the proposed algorithm can be implemented and controlled effectively. Monte Carlo simulations confirm that our method is robust to noise or the presence of weak factors. Furthermore, the application to financial time-series shows that our estimators capture essential aspects of market dynamics.
---
中文摘要：
在处理高维数据集时，因子模型通常有助于降维。因子模型的估计在各个领域都得到了积极的研究。在本文的第一部分中，我们提出了一种利用残差的经验谱密度估计高维因子模型的新方法。金融数据协方差矩阵的频谱通常表现出两个特征方面：少量峰值和大量。前者代表主要驱动特征的因素，后者则来自于特殊噪声。出于这两个方面的考虑，我们考虑了两个光谱之间的最小距离；一个来自协方差结构模型，另一个来自通过减去主成分获得的金融数据的实际残差。我们的方法同时提供了因子数量的估计量和残差中相关结构的信息。利用自由随机变量技术，该算法可以有效地实现和控制。蒙特卡罗模拟证实，我们的方法对噪声或弱因素的存在具有鲁棒性。此外，对金融时间序列的应用表明，我们的估计量捕捉到了市场动态的基本方面。
---
分类信息：

一级分类：Quantitative Finance 数量金融学
二级分类：Statistical Finance 统计金融
分类描述：Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--
一级分类：Physics 物理学
二级分类：Data Analysis, Statistics and Probability 数据分析、统计与概率
分类描述：Methods, software and hardware for physics data analysis: data processing and storage; measurement methodology; statistical and mathematical aspects such as parametrization and uncertainties.
物理数据分析的方法、软硬件：数据处理与存储；测量方法；统计和数学方面，如参数化和不确定性。
--

---
PDF下载：
-->

Random_matrix_approach_to_estimation_of_high-dimensional_factor_models.pdf
大小:(811.63 KB)

马上下载

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

可人4

2022-6-28 09:31:14

高维因子模型的估计在统计学和计量经济学中得到了广泛的研究[1、3、4、10、11、12、21、22、30、38]。本文提供了一种利用残差的奇异值分布估计高维因子模型的新方法。根据最小距离法，我们估计*uriyeobi@gmail.com，斯坦福大学计算与数学工程研究所，斯坦福，加利福尼亚州94305，美国+papanico@math.stanford.edu，斯坦福大学数学系，斯坦福，加利福尼亚州94305，USAof因子和残差的相关结构。通过Montecarlo仿真验证了该方法的有效性，在我们考虑的大多数情况下，该方法的性能优于其他已知方法。此外，财务数据的结果表明，我们的估计员有效地捕捉到了结构性市场变化。考虑如下因素模型。对于i=1、····、N和t=1、····、t，Rit=pXj=1LijFjt+Uit（1），其中riti是时间t时第i个单位的数据（如资产回报），Ftjis是时间t时的第j个系数，li是第j个系数对第i个横截面单位的负荷。UIT是Rit的特质成分或剩余量。通常，只有R是可见的。因此，以下问题是可能的：1。如何估计F（因子）和L（因子载荷）？2、如何估计p（因子数）？3、U=R- LF。U（残差）的性质是什么？它们是噪音还是仍然包含信息？对于第一个问题，给定p，主成分可用于估计F和L。对于第二个和第三个问题，一种方法是通过查看R的协方差矩阵的奇异值来确定p，并根据给定的方差解释阈值取其中一些值。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

nandehutu2022

2022-6-28 09:31:21

前者依赖于ANand BT的建模，但我们假设一个简约的矩阵结构，仅由一个小参数集（θAN，θBT）决定。这不是最通用的模型，因为互协方差和自协方差的贡献是解耦的：cov（Uit，Ujs）=ANijBTts。我们假设每个时间序列Uit（t=1，···，t）是归一化的，并且具有单位方差。我们搜索因子数（p）和参数集（θAN，θBT），以使模型和实际数据之间的光谱距离最小化。这种基于频谱的方法由真实数据频谱中的两个典型特征方面驱动：少量峰值和大量。前者代表主要驱动市场特征的因素，后者则来自于特质噪音。这也是由[43]的结果在理论上推动的，该结果分析了在某些假设下，CNT的经验特征值分布收敛到合适的极限分布。因子模型估计问题说明如下。{p，θ}=arg minp，θDρ实（p），ρ模型（θ）（2）其中ρreal（p）是通过从原始数据中去除p个主成分构建的残差协方差矩阵的经验特征值密度，ρmodel（θ）是以参数集θ=（θan，θBT）为特征的一般协方差矩阵的极限特征值密度，d是我们选择的谱距离度量或损失函数。该最小化问题的解给出了残差相关结构的因子数和参数。至于估计因素的数量，在以前的文献中提出了几种方法【1、4、21、22、30】。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

何人来此

2022-6-28 09:31:24

与其他估计器的主要区别在于，我们的方法找到了整个光谱分布的最佳拟合，这使我们能够同时考虑峰值和大部分分布。ρ模型（θ）的计算存在困难，因为在一般情况下使用Tieltjes变换中的极限分布非常复杂。然而，[9]最近的一项工作使用自由随机变量技术提供了极限光谱密度的解析推导。本文利用这些结果计算ρ模型（·）。此外，我们提出了一个简单的估计问题，该问题考虑了ANA和BT的简约矩阵结构。特别是，假设互相关被因子有效去除，我们假设归一化残差之间的互相关可以忽略不计：一个≈ IN×N（或上例中的β=0）。但我们仍然假设它们是连续相关的，与时滞相关的指数衰减：（BT）ij=b | i-j |。然后将ρ模型（θAN，θBT）替换为ρ模型（b），最小化问题只有两个标量变量p和b。这种简约模型有两种意义。首先，它有利于可计算性，因为我们采用了自由随机变量技术。其次，参数b表示残差均值回归的整体速率。残差的均值回归特性在当前金融市场中越来越受到关注，尤其是在统计套利策略中[42]。我们工作的第二个主要贡献是，通过使用已知模型生成的合成数据进行测试，验证了所提出的方法。用合成数据进行的蒙特卡罗模拟表明，估计量的有限样本性能良好。对于N和T的各种选择，因子数量和自回归参数都得到了准确估计。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

大多数88

2022-6-28 09:31:27

我们将我们的方法估计的因子数与文献中其他方法估计的因子数进行了比较，结果表明我们的方法对噪声具有鲁棒性，并且在识别弱因子方面表现良好。第三个贡献是，我们发现，利用真实的市场时间序列数据，我们对简化问题的估计成功地捕捉到了市场动态。我们提出的估计问题是静态的，因此为了观察参数的时变行为，我们使用移动窗口重复估计过程。对于市场数据，我们使用2000-2015年期间标准普尔500指数股票的日收益率。我们计算估计量的时间变化。结果表明，估值器反映了市场的制度变迁信息。特别是，我们发现，在应力期间，ρreal（p）可以通过数据轻松获得。详情见第4.1节周期，因子数量正在减少，而相应因子解释的方差增加，这表明市场凝结。此外，由估计的自回归系数b表示的残差的全局平均回归时间非常接近于波动率指数。我们还发现，在危机期间，残差更具趋势性，平均值回复速度较慢。论文的其余部分包括以下内容。在第二节中，我们回顾了相关文献。在第3节中，我们考虑一个激励示例。第4节描述了我们对因子模型的估计方法，并描述了使用的程序。第5节包含蒙特卡罗分析以及与其他方法的比较。第6节展示了具有真实数据的应用程序。我们在第7.2节相关文献中得出结论，我们在高维环境中的方法基本上基于随机矩阵理论。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

mingdashike22

2022-6-28 09:31:30

Randommatrix理论最初是为了研究复杂量子系统中的相互作用而发展起来的【41】，可以用来识别偏离普遍预测的非随机性质。【24】和【33】是将随机矩阵理论应用于金融相关性的前两项研究，物理学界也有无数论文紧随其后【13、29、34、35、37】。[6]和[7]提供了关于随机矩阵理论财务应用的综合观点。他们从股票收益率分析了经验互相关矩阵的特征值分布。他们的目标是偏离理论预期的特征值，即马尔琴科-Pastur定律[26]，提供真实的市场信息，如市场模式或工业部门。然后通过计算这些偏离特征值来确定因子的数目。然而，在散装区域，“无信息”或“纯噪声”假设过于严格，在实践中证明是无效的。如第3节中的示例所示，协方差矩阵的经验谱密度从实际剩余收益到马尔琴科牧场分布的拟合存在问题。这意味着真实数据的残差不一定是纯噪声，需要考虑更一般的相关结构来评估经验密度。【43】的惊人工作为我们的估计方法提供了核心理论基础。作者考虑了形式为CN=TA1/2N的一般协方差矩阵CN英国电信TA1/2N，其中An和Bt分别是大小为N×N和T×T的非负有限矩阵，以及具有i.i.d.条目的isan N×T高斯随机矩阵。设c=不适用。[43]表明，在某些假设下，Cn的经验特征值分布弱收敛于非随机分布Fc，a，B。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

大多数88

2022-6-28 09:31:33

在本文中，我们引入了一个具有简单参数化的近似模型，并使用文献[9]中介绍的技术直接推导出特征值的概率分布。然后，我们将模型的频谱与实际数据联系起来。同时，金融中的因子模型框架由[36]提出，提出了随机定价理论。由于宽松的假设允许特质成分中存在弱相关性，因此[10]引入了近似因子模型。动态因素模型[40]也受到了关注。许多物理学研究人员还试图利用因子分析揭示金融市场数据中的相关结构[5、20、25、27、28]。高维因子模型中因子数量的确定是理论和实践中的关键问题之一。文献[4]的原始工作使用信息标准来确定数字因子。【22】是第一个使用特质结构思想的人。作者指出，特质成分的相关假设意味着本文所考虑的特征值分布的特质特征值的尖锐渐近上界的闭合形式表达式由许多有界的小特征值（散装）和几个大特征值（尖峰）组成。样本协方差矩阵。因此，他声称，计算边界以上的特征值可以估计因子的数量。【30】提供了一个使用两个相邻智能值差异的标准。基于特征值比的方法也在[1]中得到发展，最近在[32]中也得到发展，用于高频数据。[21]还提出了一种使用光谱估计因子数量的方法。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

kedemingshi

2022-6-28 09:31:36

与[21]和我们的不同之处在于，前者只考虑前几分钟，而我们的方法使用整个概率密度，并通过使用适当的度量考虑了峰值和协方差矩阵的体积的特征方面。因此，我们的方法不需要决定需要花费多少时刻，并且在使用高阶矩时不存在不稳定性。此外，我们的研究侧重于全球平均回归率，并用实际数据研究其动力学。3示例：MP定律与真实数据的问题在本节中，我们说明了马琴科·帕斯托尔（MP）[26]定律在多大程度上可以解释从真实市场数据和合成数据中去除因素后的残差谱。至于实际数据，我们获得了2012-2015年标准普尔500指数中400只股票的日回报率（N=400，T=1000）：Rrealit=Sit- Si，t-1Si，t-1.（3）其中Sitis是时间t时股票i的价格。第二，相同维度（N=400，t=1000）的合成数据由以下模型生成synit=pXj=1LijFjt+Uit（4），其中Fjt~ N（0，0.1），Lij，Uit~ N（0，1）是独立的，因子p的真实数目设置为3。也就是说，合成数据的相关结构是已知的，而实际数据的情况并非如此。接下来，对于每个Rreland Rsyn，我们通过去除因子，使用主成分：^U（p）=R构建p级残差-^L（p）^F（p）（5），其中^L（p）^F（p）是p主成分的估计公因子。我们感兴趣的是残差协方差矩阵的特征值分布^U（p）：^C（p）=T^U（p）^U（p）T（6）。残差的特征值分布如图1所示。从图中可以看出，经验谱由大量和少量尖峰组成。对于原始数据的频谱（无因子移除），有三个峰值，对应于我们生成的三个因子。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

kedemingshi

2022-6-28 09:31:39

然而，当去除因子的真实数目（3）因子时，残差的谱密度收敛于MP定律。相反，如图2所示，无论减去多少因素，具有真实数据残差的密度都不符合MP定律。这一实验促使我们发展本文的主要思想：我们允许U的相关性和两个分布之间的最小特殊距离来估计因子模型。0 2 4 600.20.40.60.81特征值密度未移除因子0 2 4 600.20.40.60.81移除特征值密度1因子0 2 4 600.20.40.60.81移除特征值密度2因子0 2 4 600.20.40.60.81移除特征值密度3因子图1移除少数主要成分时，合成数据中残差协方差矩阵的IGENVALUE分布。因子的真实数目p设置为3。当去除3个因素时，相应的尖峰都会被去除，剩余的大块部分会很好地符合马尔琴科牧场（MP）定律。0 1 2 3 4 5 x 10-30500100015002000Featuresdensityno factor removed0 1 2 3 4 5x 10-30500100015002000CharacteristesDensity10因子去除0 1 2 3 4 5x 10-30500100015002000CharacteristesDensity20去除的因子0 1 2 3 4 5x 10-30500100015002000FeaturesDensity30因子去除图2实际数据中残差协方差矩阵的IGENVALUE分布。无论去除了多少因素，剩余部分都无法用MP定律来解释。我们还证实，使用相关矩阵及其特征值也会产生相同的问题。4因素模型估计我们的估计方法旨在找到两个光谱之间的适当匹配。一种是通过从实际数据中去除因素得到的残差的经验leigenvalue分布。另一种是残差的经验特征值分布，其协方差结构由参数集建模。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

kedemingshi

2022-6-28 09:31:42

一旦得到这两个分布，我们就最小化这两个分布之间的距离，以便我们可以估计所需的参数。我们的工作是首次应用该模型估计真实数据剩余收益的协方差结构。图3说明了估算程序。图3因子模型估算程序示意图。基于谱的最小距离，估计残差协方差结构的因子数（p）和参数（θ）。4.1ρreal（p）：使用主成分第一步是通过从实际数据中提取p个最大主成分来生成经验残差。这里我们使用主成分作为因子。在大维度数据中，主成分确定的投资组合大致模拟了旋转前的所有真实因素【2、17、39】。如果实际存在不止一个因素，则方程式5中的p级残余^U（p）可始终计算p≥ 1.p级残差的协方差矩阵由式6给出：C（p）real=T^U（p）^U（p）T。（7）下标real表示它是根据实际市场数据构建的。我们的目标是通过在算法中控制p，从C（p）实数的光谱分布中找出因子的数量。这之后的想法很简单。我们不断减去因子，直到使用真实数据从残差中得到的体谱与建模残差的体谱接近。4.2ρ模型（θ）：建模剩余过程的协方差下一步是建模剩余过程的协方差结构。对于互协方差矩阵和自协方差矩阵BT，让残差具有一定的协方差结构，其特征是参数θana和θBT。然后我们可以假设剩余项的结构为BT1/2（8）其中是具有i.i.d的N×T不相关随机矩阵。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

大多数88

2022-6-28 09:31:45

条目和ANand Bt分别表示交叉和自协方差结构，参数为θA和θB。然后给出U的经验方差矩阵asCN=NUUT=TA1/2N英国电信TA1/2N（9）注意，如果ANand Bt的经验光谱分布收敛，则表明当N和T较大时，Cn的光谱分布收敛到一个合适的极限（见附录中的引理1）4.3光谱距离度量由于经验光谱包含尖峰，并非所有距离度量在该问题中都有用。我们的方法需要一个指标，该指标必须对尖峰的存在敏感，并能正确反映分组特征值的分布。对于我们考虑的协方差矩阵，我们测试了几个距离度量。我们使用Jensen-Shannon散度，这是Kullback-Leibler散度的对称化。DJS（P kQ）=DKL（P kM）+DKL（QkM）（10），其中P和Q是概率密度，M=（P+Q），DKL（P kQ）是由DKL（P kQ）=PiPilogPiQi定义的Kullback-Leiblerdivergence。请注意，如果一个密度在某一点上有尖峰，而另一个密度在该点上几乎为零，那么Kullback-Leibler距离会变大。此外，使用该度量还考虑了块体区域中的信息差异。附录C.4.4因子模型估计中进一步讨论了离散网格下Kullback-Leibler散度的数值计算。现在，我们准备在这里说明估计问题。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

nandehutu2022

2022-6-28 09:31:48

我们解决了一个最小化问题，该问题搜索剩余过程协方差矩阵的有效参数集和因子的数量，从而使模型的频谱与实际数据的频谱之间的距离最小。{p，θ}=arg minp，θDρ实（p），ρ模型（θ）（11）其中ρreal（p）是C（p）real的特征值分布，ρmodel（θ）是以参数集θ=（θAN，θBT）为特征的一般协方差矩阵的极限特征值密度，D是我们选择的谱距离度量或损失函数。该问题同时估计了残差相关的因子数和参数。附录1讨论了估计量的一致性。该模型被称为Kronecker模型，广泛应用于通信领域【23】，最近引入了非计量经济学【30】。4.5残差协方差结构简化模型如前所述，当使用主成分估值器作为因子时，ρreal（p）的计算非常简单。对于一般θ=（θAN，θBT），困难在于计算极限分布ρ模型（θ）。虽然引理1保证了经验谱分布收敛到一个合适的极限，并且引理得到的Stieltjes变换提供了关于极限分布的有用信息，但它的实际计算相当复杂，这使得实现困难。然而，最近的一项研究[9]提供了使用自由随机变量技术直接推导光谱密度的方法。当时间序列遵循向量自回归过程时，它们特别呈现出解析形式。在本文中，我们使用这种技术来计算谱ρ模型（·）。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

大多数88

2022-6-28 09:31:52

为此，我们从剩余过程谱的平均场模型出发，提出了一种ANand BT的简化模型。4.5.1平均场模型基于Specturma平均场模型通过研究一个更简单的模型来研究大型复杂随机模型的行为。例如，在量子自旋系统的磁性中，平均场理论认为自旋在所有其他自旋产生的平均场中移动。通常在高维系统中，平均场理论可以很好地描述相变。在因子模型中，每个特质回报都有自己的驱动力，即一个领域。与传统的平均场理论类似，我们没有单独考虑每个残差，而是考虑单个相关结构，使我们能够近似复制原始异源相关结构的光谱密度。权利要求1（频谱平均场模型）。假设我们有两个N×T矩阵，Y和Z，这样一来，Y=biYi，T-1+ξit（12）Zit=bZi，t-1+ηit（13），其中| bi |<1，b=NPbi，ξit~ N（0，σi）和ηit~ N（0，σ）。设σi=1- biandσ=1- b、所以var（Y）=var（Z）=1。考虑两种经验光谱分布，ρCYandρCZ，其中cy=TY yt，CZ=TZZT。然后ρCYandρcz之间的距离变得非常小，因为N，T很大。DρCY，ρCZ≈ 0（14）对于该索赔，我们提供了一个数字说明。我们首先从0到1之间的均匀分布中抽取bi的随机数，并取几个不同的“b值”，b=0.35、0.5、0.65。Y和Z的合成数据集由上述等式中的自回归过程生成。在图4中，我们给出了特征值分布CYand CZ。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

kedemingshi

2022-6-28 09:31:55

在b=0.35、0.5、0.65的情况下，我们发现当b=0.5（黑线）时，ρCY（红线）的光谱最接近ρcz，并且光谱距离（本例中的Kullback-Leibler距离）在同一点最小。4.5.2因子模型估计与简化模型现在，我们为ANand BT提出了一个改进模型，该模型的参数集更为简单。假设如下：0 1 2 3 4 500.20.40.60.811.2IgenvaluesDensity bi~U[0,1]bm=0.35bm=0.50bm=0.650 0.2 0.4 0.6 0.8 100.10.20.30.40.5bmkulback-Leibler距离图4权利要求1的数值演示。（左）：b的非均匀过程Y的特征值分布~ U【0，1】（红色），以及来自齐次自回归过程Z的‘b=0.35、0.50和0.65，对于N=300，T=600。（右）：ρCYandρCZ之间的Kullback-Leibler距离。请注意，距离最小，接近“b=0.50”时几乎为零，这实际上是BI的理论平均值。1。有效地从p主成分中去除了互相关，其中p是因子的真实数量，剩余U（p）具有完全可忽略的互相关：≈英寸×N.2。U的自相关随时间滞后呈指数递减（以相同的速率递减）：英国电信ij=b | i-j |，b |<1。（这相当于将剩余收益建模为AR（1）过程：Uit=bUi，t-1+ξit，其中ξit~ N（0，1- b）因此，Utisone的方差。）根据上述假设和前一节中的谱平均场模型，我们仅使用两个控制变量（因子数量p和总体平均回归率b）来近似原始估计。简而言之，使用简单参数化的估计表示为{p，^b}=arg minp，bDρ实（p），ρ模型（b）. （15）对于以下章节中的数值实验，我们使用此简化模型。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

nandehutu2022

2022-6-28 09:31:58

虽然乍一看似乎太简单了，但我们将证明它能够有效地提高对噪声水平的鲁棒性和检测薄弱因素的能力。4.5.3ρ模型（b）的计算简化的问题使我们能够更容易地计算建模的光谱密度ρ模型（b）。这可以通过使用[9]中提出的自由随机变量技术来实现。我们在此简要介绍了主要的实现。1、平均光谱密度可通过使用索霍茨基公式从格林函数G（z）得出：ρ模型（λ）=-πlim→0+ImGc（λ+i). (16)2. 格林函数G（z）可以由矩母函数M（z）得到。M（z）=zG（z）- 1 (17)3. 通过求解M=M（z）（a）的多项式方程，可以找到M（z=√1.- 波段C=不适用）：acM+2ac- （1+b）z+acM+（18）(1 - b） z- 2ac（1+b）z+（c- 1） aM- 凌晨2点- a=0详见附录B。备注：虽然这个简化模型来自我们对协方差矩阵的假设，但它实际上有很多好处。首先，它使密度的计算几乎是解析式的。如果我们使用自由随机变量技术，获得谱密度ρ模型（b）的数值过程很简单。其次，这两个参数反映了我们所考虑的协方差矩阵典型谱的基本特征。如前所示，光谱大致分解为两部分：尖峰和块状。参数p控制残差中尖峰的数量。当我们从数据中减去p因子时，对应于p最大特征空间的p尖峰将从原始数据的频谱中移除。同时，参数b控制较小特征值的区域。虽然它不能代表所有可能的块状物形状，但它可以有效地模拟残余物的块状谱的变化。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

kedemingshi

2022-6-28 09:32:01

根据数值结果，结果表明，块体的边缘在所需的数值精度范围内是可以有效控制的。此外，我们还从蒙特卡罗模拟中发现，仅使用b的方法仍然可以准确估计因子的数量。第三，参数b是表示剩余收益平均回复率的总量。近年来，剩余空间的动力学受到了极大的关注。虽然它不能直接应用于任何实际用途，如交易，但使用此单一参数对真实市场的剩余子空间进行表征，可以了解市场动态。5蒙特卡罗分析5.1实验设置我们通过蒙特卡罗研究来评估我们估计方法的性能。我们首先使用以下模型生成合成数据：Xit=pXj=1LijFjt+√θUit；（19）（20）Uit=s1- ρ1+2Jβeit（21），其中（22）eit=ρei，t-1+维生素+i-1Xh=最大值（i-J、 1）βvht+最小值（i+J，N）Xh=i+1βvht（23）vht，Lit，Fjt~ N（0，1）（24）该模型也用于其他文献[1，4，30]。该模型的基本原理如下。1、系数1- ρ1+2Jβ使Uit的方差始终为1。这允许模型仅通过θ控制残差的方差（或噪声）水平。θ控制信噪比，其中SNR=var（F actors）var（Residuals）=pθ。我们将使用1/SNR代替θ来表示噪声级。例如，如果1/SNR=0.25，这意味着θ=0.25×p.3。ρ控制残差自相关的衰减速率。(|ρ| < 1)4. 对于|β|震级，残差的互相关由β控制≤ 1和J表示有效范围。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

mingdashike22

2022-6-28 09:32:04

由于在实践中，对于较大的系统，这种局部互相关可以更广泛，因此我们设定J与N成正比，即J=N/10。表1总结了蒙特卡罗分析中使用的模型参数。样本量N，T{50，100，200，300，500}因子数p{3，4，5}1/信噪比θ{0.1，0.25，0.5，0.75，1，1.5，2，3}×p残差相关系数（ρ，β，J）{（0，0，0），（0.5，0，0），（0，0.5，N/10），（0.5，0.5，N/10）}表1蒙特卡罗实验中使用的参数配置。我们首先通过用真实值检查估计值来研究我们方法的性能。接下来，我们关注的是因素的数量。我们的方法估计的因子数与[4]、[30]和[1]的其他三种方法估计的因子数进行了比较。为此，我们从以下几个方面进行了研究：（1）样本大小变小或变大时的误差收敛速度，（2）不同残差相关结构对估计误差的影响，以及（3）不同噪声水平下的性能。最后，我们测试了弱因素存在时的检测能力。作为一种误差度量，均方根误差（RMSE）可在1000次重复中获得。在计算特征值和特征向量之前，对每个序列进行细分和标准化，以获得单位方差。5.2估计性能首先检查我们的方法在估计因子模型方面的性能。表2总结了^p和^b的平均值。我们可以首先观察到，我们估计值的平均值，^p和^b，与N和噪声1/SNR范围内的真实因子数量和真实自相关系数非常接近。一个例外是当样本量很小，噪声量很大时，我们的估计量开始低估因子的真实数量。真实的相关结构在测试中也会发生变化。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

能者818

2022-6-28 09:32:07

ρ表示残差的相同自回归系数，β表示矩阵中J范围内的互相关。对于残差无相关性的第一种情况，如（ρ，β）=（0，0），估计量^b给出的数字介于0.03和0.05之间，接近真值0。当施加自相关时，当（ρ，β）=（0.5，0），^b也非常接近真值0.5。在此处添加互相关结构，如（ρ，β）=（0.5，0.5），会移动平均值并降低精度，但不显著。这是因为在我们的实验装置中，局部互相关对光谱的贡献与自相关的贡献相比微不足道。然而，当在真实残差过程中仅强制进行交叉关联时，如（ρ，β）=（0，0.5），则^b的平均值与真实值0相差甚远，给出的值介于0.1和0.25之间。我们解释说，从光谱角度来看，这种偏离的^b对光谱的影响与互相关的贡献近似相等。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群