全部版块 我的主页
论坛 经济学人 二区 外文文献专区
2022-6-14 09:41:42
直观地说,LSTM使用不同的TRNN结构来建模短期和长期依赖关系,并将其与非线性函数相结合。我们可以将LSTM视为大维系统的灵活隐藏状态空间模型。一方面,它提供了一个类似于latentfactor模型的横截面聚合。另一方面,它提取了与状态空间模型在精神上相似的动力学,例如通过卡尔曼滤波器估计的简单线性高斯状态空间模型。LSTM的优势在于它将这两个元素结合在一个一般的非线性模型中。在B部分的模拟示例中,我们说明了LSTM可以成功地提取商业周期模式,该模式从本质上捕获本地平均值与长期平均值的偏差。同样,我们实证分析中的状态过程似乎也基于宏观经济增量的短期和长期平均值之间的关系,因此代表了一种商业周期类型的行为。LSTM的输出是少量的状态过程ht=hLSTM(x,…,xt),我们使用这些状态过程代替宏观经济变量作为SDF网络的输入。请注意,每个州的HTH仅取决于当前和过去的宏观经济增量,没有前瞻性偏差。D、 生成对抗网络(GAN)调节函数g是第二个前馈网络的输出。受生成性对抗网络(GAN)的启发,我们选择了两个网络相互竞争,从而导致最大PricingDiscreency的时刻条件。一个网络创建SDFMt+1,另一个网络创建调节功能。我们采取三个步骤来训练模型。我们的第一步SDF将无条件最小化。其次,给定此SDF,我们通过优化条件网络中的参数来最大化损失。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 09:41:45
最后,在给定条件网络的情况下,我们对SDF网络进行更新,以最小化条件损失。这个想法背后的逻辑是,通过最小化所有可能条件函数的最大条件损失,任何函数的损失都很小。请注意,DF网络和条件网络均使用FFN网络与LSTM相结合,以估计宏观经济隐藏状态变量,即,不是直接使用ITA,而是使用输入每个网络汇总状态过程ht中的整个宏观经济时间序列信息(分别为条件网络的HGTF)。这两个LSTM基于两个网络的标准函数,即HTM是可以最小化定价错误的隐藏状态,而hgt生成错误定价最大的测试资产:{ω,^ht,^g,^hgt}=minω,htmaxg,hgtL(ω| g,hgt,ht,It,i)。E、 超参数与集成学习由于问题的高维性和非线性,训练深层神经网络是一项复杂的任务。在这里,我们总结了实施情况,并在附录A.C.中提供了更多细节。我们通过使用“退出”来防止模型过度拟合,并处理大量参数,这是一种正则化形式,通常比传统l/l正则化具有更好的性能。我们通过采用基于梯度的自适应学习率来精确高效地优化目标函数。我们通过对多个模型的集合平均来获得稳健和稳定的结果。神经网络的一个显著特点是,估计结果可以依赖于优化中使用的起始值。Gu、Kelly和Shui(2020)也采用的标准实践是,使用从最优分布中选择的不同初始值分别训练模型。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 09:41:49
对多个函数进行平均可以实现两个目标:第一,它可以减少局部次优函数的影响。第二,它可以减少估计模型的估计方差。我们所有的神经网络(包括预测方法)都在九个模型上取平均值。让^w(j)和^β(j)分别是jthmodel fit给出的SDF载荷的最优投资组合权重。插入模型是具有相同架构但优化起始值不同的模型输出的平均值,即ω=Pj=1ω(j)和β=Pj=1β(j)。请注意,对于向量值函数,例如调节函数g和宏观经济状态h,报告其模型平均值没有意义,因为向量中的不同条目不一定会反映每个函数中的相同对象。我们将数据分割为训练、验证和测试样本。验证集用于调整超参数,其中包括网络的深度(层数),传统的GAN网络会迭代此过程直到收敛。我们发现,我们的算法在上述三个步骤后收敛,即模型不会通过重复对抗性博弈而进一步改进。用于实证分析的GAN迭代的详细结果如图IA所示。1在互联网附录中。我们考虑到SDF和条件网络的潜在不同宏观经济状态,因为识别SDF的无条件矩条件可以取决于不同于SDF权重的状态。超过九个模型的集合产生非常稳健和稳定的结果,并且不会对超过多个模型的平均值产生影响。结果可根据要求提供。每层(节点)的基函数数、宏观经济状态数、调节工具数和调节网络结构。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 09:41:52
我们通过最大化SDF对验证数据的夏普比率,在所有可能的超参数组合中选择最佳配置。根据试验数据对优化模型进行了评价。我们的优化模型有两层,四个经济状态和八个测试资产工具。我们的结果对第III.H节中讨论的调整参数具有鲁棒性。特别是,我们的结果不依赖于网络的结构,验证数据上表现最好的网络提供了基本相同的模型,在测试数据上具有相同的相对性能。预测方法的FFN使用Gu、Kelly和Xiu(2020)选择的最优超参数。这样做的另一个好处是,我们的结果可以与他们的结果直接进行比较。F、 模型比较我们通过计算SDF的夏普比率、解释变化量和定价误差来评估我们模型的性能。我们将我们的GAN模型与其线性特例(一个线性因子模型)和深度学习预测方法进行了比较。单因素表示法产生了三个性能指标来比较不同的模型公式。首先,SDF是在全球效率前沿构建的,应具有最高的条件夏普比率。我们使用SDF投资组合的无条件夏普比率SR=E[F]√V ar【F】作为评估模型定价性能的一种度量。第二个指标衡量SDF解释的变量。解释的变化定义为1-PNi=1E[i] PNi=1E【Rei】,其中II荷载横截面回归的剩余值。正如Kelly、Pruitt和Su(2019)所述,由于平均值估计中的非平稳性和噪声,我们不会降低回报率。我们的解释变异度量可以解释为时间序列R。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 09:41:55
第三个绩效衡量指标是平均收益归一化的平均定价误差,以获得横截面RME衡量1-NPNi=1E[i] NPNi=1E【Ri】。我们的GAN模型的输出是SDF因子权重^ωGAN。我们通过建立前馈网络来预测Ret+1Ft+1,从而估计Et【Ret+1Ft+1】,从而获得风险敞口^βGan。请注意,该负荷估计值^βGANis仅与总体值β成比例,但这对于预测系统和非系统组件是有效的。我们称之为FFN的传统预测方法产生的条件平均值^uF N与β成正比,因此在投影中用作^βF nni。同时,μF与SDF因子组合权重成正比,因此也可作为μωF N。因此,GAN和FFN之间的根本区别在于GAN估计条件二阶矩βGAN=Et【Ret+1Ft+1】,而FFN则估计横截面定价的条件一阶矩βF N=Et【Ret+1】。我们使用了不同的标准函数,包括最小化力矩条件的误差,来选择超参数。结果几乎相同,可根据要求提供。请注意,标记为LS的线性模型是具有显式解^θLS的特例=TTXt=1NNXi=1Ret+1,iIt,i!NNXi=1Ret+1,iIt,i!>-1NTTXt=1NXi=1ET+1,iIt,i=TTXt=1英尺+1英尺>t+1!-1TXT=1F>t+1!SDF因子投资组合权重ωLS=^θ>LSIt,i.风险敞口^βLSI是通过Ret+1Ft+1的线性回归得到的,i.由于我们的设置中特征的数量非常多,线性模型可能会受到过度拟合的影响。非线性模型包括一种正则化形式,用于处理大量特征。为了使模型比较有效,我们还对线性模型添加了正则化。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 09:41:58
正则化线性模型EN向回归中添加弹性网惩罚,以获得^θENand,并对^βEN进行预测回归:^θEN=arg minθTTXt=1Ft+1-TTXt=1英尺+1英尺>t+1θ!+λkθk+λkθk。弹性网的线性方法与Kozak、Nagel和Santosh(2020)密切相关,他们对基于特征的因子进行弹性网惩罚的均值-方差优化。此外,我们还报告了基于AMA-French 3和5因子模型的相切投资组合的最大夏普比率。对于四个模型GAN、FFN、EN和LS,我们获得了用于构造SDFan的ω的估计和用于计算残差的β的估计. 我们通过预测估计风险敞口^β:^的回报来获得系统和非系统回报成分t+1=在中-^βt(^β>t^βt)-1^β>tRet+1。对于每个模型,我们报告(1)SDF因子的无条件夏普比,(2)解释弹性网包括套索和脊正则化作为特例。根据验证数据,我们对弹性网络的调谐参数进行了优化选择。他们的论文有五个不同之处。首先,他们使用基于贝叶斯先验的修正岭惩罚。其次,它们还包括产品术语的特征。第三,他们的二阶矩矩阵使用demeanedreturns,即这两种方法在全球有效前沿选择不同的均值方差有效投资组合。第四,我们考虑了基于特征的因素的长短腿上的不同线性权重。第五,他们建议在用弹性净惩罚解决均值-方差优化之前,首先对特征管理因子应用PCA。Lettau和Pelger(2020)将鲁棒SDF恢复推广到RP-PCA空间。Bryzgalova、Pelger和Zhu(2020)也在稳健SDF恢复中加入了额外的平均收缩率,并提出决策树作为PCA的替代方法。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 09:42:01
Bryzgalova、Pelger和Zhu(2020)也表明,具有正则化的均值-方差优化可以解释为具有参数不确定性的对抗性方法。我们使用传统的长短因子作为基准,因为它们是文献中最常用的线性模型。基于PCA的方法推迟到第III.J节。相切投资组合权重在训练数据集上获得,并用于验证和测试数据集。个体股票收益率的变化和(3)横截面平均值:SR=^E[Ft]qdV ar(Ft),EV=1-TPTt=1 NTPNTI=1(^)t+1,i)TPTt=1NtPNti=1(Ret+1,i), XS-R=1-NPNi=1TiTTiPt公司∈Ti^t+1,iNPNi=1TiTTiPt公司∈Ti^Rt+1,i.这些是线性资产定价中使用的标准度量的概括。我们还对传统的特征分类投资组合评估了我们的模型。portfolioloadings是由投资组合权重加权的股票负载的平均值。更详细地说,我们的模型为每个单独的股票i提供了风险负荷βt,i。投资组合的风险负荷βt是通过聚合相应的股票特定负荷获得的。我们从每个时间点的投资组合βt的投资组合回报的横截面回归中获得投资组合误差。这类似于线性模型中的标准横截面Fama-MacBeth回归,主要区别在于βt是从我们的SDF模型中获得的。投资组合的EV和XS RFR指标遵循与单个股票相同的程序,但使用投资组合代替股票回报。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 09:42:04
对于单个分位数,我们还报告了由所有相应分位数排序投资组合的均方根平均收益未归一化的定价误差^α,即^αi=^E[^t、 i]qNPNi=1^E[Rt,i]。附录B包括一个模拟,说明所有三个评估指标(SR、EV和XS-R)都是评估SDF质量所必需的。像FFN这样的模型可以通过加载一些极端的投资组合来实现高清晰度,但这并不意味着它能够正确地捕获加载结构。类似地,线性因子可以实现高夏普比,但通过构造无法捕捉SDF载荷中的非线性和相互作用效应,这反映在lowerEV和XS-R中。无论模型的灵活性如何(例如FFN),仅通过调节最近的宏观经济观察,一般宏观经济动态被排除,这似乎是夏普比率中反映最强烈的。GAN模型中的无套利条件有助于处理低信噪比,并正确估计风险溢价较小的股票的SDFloadings,这反映在XS-R.III《美国股票a的实证结果》中。数据我们收集CRSP上所有证券的月度股权回报数据。样本期为1967年1月至2016年12月,共50年。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 09:42:07
我们将全部数据分为20年的训练样本(1967-1986)、5年的验证样本(1987-1991)和25年的样本外。我们通过其收敛速度对估计的平均值进行加权,以解释精度上的差异。注意,XS-R=1-PNi=1^αi.Pelger和Xiong(2019)提供了理论论点,并在线性设置中以经验证明了为什么仅正确捕获极端因子权重的“近似”因子与人口因子具有类似的时间序列特性,但其投资组合权重不是正确的载荷。测试样本(1992-2016)。我们使用KennethFrenchdata库中的一个月国库券利率作为无风险利率来计算超额收益。此外,我们收集了Kenneth French DataLibrary上列出的46个企业特定特征,或Freyberger、Neuhierl和Weber(2020)使用的特征。所有这些变量都是根据CRSP/Compustat数据库中的会计变量或CRSP过去的返回数据构建的。我们在变量定义、构造及其更新方面遵循标准惯例。每年更新的变量在Fama Frenchconvention之后的每年6月底更新,而每月变化的变量在每个月底更新,以便在下个月使用。有关这些变量构造的完整详细信息,请参见互联网附录。在表A.II中,我们将特征分为六类:过去收益、投资、可盈利性、无形资产、价值和交易摩擦。CRSP的所有可用库存数量约为31000支。正如Kelly、Pruitt和Su(2019年)或Freyberger、Neuhierl和Weber(2020年)所述,我们仅限于在某个月内拥有所有公司特征信息的股票回报,这使得我们拥有约10000只股票。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 09:42:10
这是可用于此类分析的最大数据集。对于每个月的每个特征变量,我们将其横截面排序,并将其转换为分位数。这是处理不同规模的标准转换,Kelly、Pruitt和Su(2019)、Kozak、Nagel和Santosh(2020)或Freyberger、Neuhierl和Weber(2020)等也采用了这一转换。在线性模型中,预测▄Ft+1=NPNi=1It,iRet+1,ire导致长-短因子,特征值高于中值的股票的正权重增加,而低于中值的股票的负权重减少。我们通过分别包括每个特征的正支腿和负支腿来增加线性模型的灵活性,即我们取特征值中位数以上的股票的秩加权平均值,中位数以下的股票的秩加权平均值。这将导致每个特性有两个“因素”。请注意,我们的模型将传统的长短因子作为特殊情况包括在内,其中长短腿在SDF中接受相同的相对符号绝对权重。这些因素仍然是零成本投资组合,因为它们基于超额回报。我们使用Freyberger、Neuhierl和Weber(2020)在2017年版论文中使用的特征。使用缺少特征信息的股票需要基于模型假设进行数据插补。Gu、Kelly和Xiu(2019)用当月该特征的横截面中值替换缺失的特征。然而,这种方法引入了额外的误差源,并忽略了特征空间中的依赖结构,从而在特征中创建了我们想要避免的艺术时间序列。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 09:42:13
因此,我们采用与Freyberger、Neuhierl和Weber(2020)以及Kelly、Pruitt和Su(2019)相同的方法,仅使用在给定月份具有所有公司特征的股票,这有额外的好处,即去除了市值非常小的主要股票。请注意,我们不要求一只股票在其整个时间序列中都具有特征。如果在这个时间点上,股票i具有所有特征,即股票i不一定有一个完整的时间序列,那么我们只包括股票i的回报时间t,这在我们的方法中是允许的。Kelly、Pruitt和Su(2019)以及Kozak、Nagel和Santosh(2020)以这种方式构建因子。在本文的第一个版本中,我们使用了传统的长短因子。然而,我们的经验结果表明,长短腿在SDF中的权重不同,这种额外的灵活性提高了线性模型的性能。这些发现也符合Lettau和Pelger(2020)的观点,他们从单排序投资组合的极端十分位数中提取线性因子,并表明它们不受长短因子的影响,而长短因子对每个特征的极端十分位数的权重相等。我们从三个来源收集了178个宏观经济时间序列。我们从FRED-MD数据库中提取了124个宏观经济预测因子,详见McCracken和Ng(2016)。接下来,我们为46个企业特征中的每一个添加横截面中值时间序列。每个特征的分位数分布与中值水平相结合,接近于表示与原始特征信息相同的信息,但以规范化形式表示。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 09:42:16
第三,我们用Welch和Goyal(2007)的8个宏观经济预测值补充时间序列,这些预测值已被视为股票溢价的预测值,并且尚未包含在FRED MDdatabase中。我们对时间序列数据应用标准转换。我们使用McCracken和Ng(2016)中建议的转换,以及Welch和Goyal(2007)中46个中值和8个时间序列的定义转换,以获得平稳时间序列。互联网附录中收集了宏观经济变量及其相应转换的详细描述。B、 GANWe的一个示例说明了GAN如何使用一个简单的示例,该示例仅使用样本中所有股票的三个特征大小(LME)、账面市盈率(BEME)和投资(投资),但忽略了宏观经济信息。我们表明,SDF权重ω中包含哪些特征,以及由条件函数g构建的测试资产中包含哪些特征,这一点至关重要。UNC表示测试资产中无条件的模型,即测试资产是单个股票收益,目标函数基于非条件矩。我们允许SDF权重取决于由UNC(SV)表示的大小和价值信息,或者还包括对UNC(SVI)的投资。GAN模型允许依赖于特性的测试资产,即g是一个非平凡函数。我们首先列出SDF权重ω中包含的特征,然后列出由g建模的测试资产中包含的特征。例如,GAN(SVI-SV)使用ω中的大小、值和投资,但仅使用g中的大小和值。为了使这个简单的示例具有可解释性,我们将g限制为标量函数。载荷β取决于与SDF权重ω相同的信息。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 09:42:19
我们还包括根据所有数据估计的基准模型,并在下一小节中进行更详细的讨论。我们评估了两组著名测试资产的资产定价表现:25个按规模和账面市值双重排序的投资组合(SV 25)和35个包括10个按投资排序的十分之一投资组合(SVI 35)。我们根据单个股票的SDF负荷和投资组合权重推断投资组合的β。图4显示了样本外夏普比率、解释的变化和横截面R。首先,在SDF权重ω中包含更多信息并不奇怪,这会导致更好的资产定价模型。与UNC(SV)相比,UNC(SVI)解释了按投资分类的投资组合的更多变化和平均回报,以及规模和账面市值投资组合。然而,关键的见解是,测试资产中的信息对SDF的恢复至关重要。加纳的测试资产(SVI-SVI)包括投资信息,这使得模型优于加纳(SVI图4:加纳插图)。该图显示了样本外的月度夏普比率(SR)、解释的时间序列变化(EV)和不同SDF模型的横截面RFR。UNC(SV)和UNC(SVI)是关于测试资产的无条件模型,也就是说,它们仅分别使用大小和价值SDF权重的大小、价值和投资,但将g设置为常数。GAN模型使用非平凡g。GAN(SVI-SV)允许SDF权重ω取决于规模、价值和投资,但测试资产函数g仅取决于规模和投资。labeledas-GAN模型是我们的基准模型,根据所有特征和宏观经济信息进行估计。我们评估了25个双排序规模和账面市值投资组合(SV 25)的模型,并添加了10个十分之一的投资组合(SVI 35)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 09:42:22
投资组合是价值加权的-SV)只有测试资产的规模和账面市值信息。根据themetric,GAN(SVI-SVI)大约是UNC(SVI)的两倍。顶栏是完整的基准模型。不足为奇的是,SR越高,通过包含其他特征和宏观经济时间序列,可以提取的信息就越多。然而,如果目标是简单地解释25个Fama-French双排序投资组合,那么GAN(SVI-SVI)已经提供了一个很好的模型。图5解释了我们观察这些发现的原因。上图显示了标度调节函数g的热图。对于GAN(SV-SV),测试资产成为长短组合,在小价值股票和大增长股票中具有极端权重。当我们添加投资信息时,测试资产基本上成为多空投资组合,对小型保守价值股票和大型积极增长股票具有极端权重。GAN以数据驱动的方式发现了Fama French类型测试资产的结构!毫不奇怪,在这些测试资产上训练的资产定价模型将更好地解释根据这些特征排序的投资组合。下图显示了该模型隐含的横截面回归的平均超额收益,以及GAN(SVI-SVI)和UNC(SVI)的25和35个分类投资组合的平均超额收益。在理想模型中,点将在45度线上对齐。UNC(SVI)无法解释小价值股票,而GAN公式很好地捕捉了所有分位数的平均回报。Internet附录包含所有模型和测试资产的详细结果。总之,这个简单的例子说明了评估资产定价模型的问题不能与选择信息性测试资产的问题分开。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 09:42:25
在下一节中,我们将进行主要分析,包括所有企业特征和宏观经济信息。请注意,g的符号未识别,我们可以将g乘以-1并获得相同的输出。图5:GAN调节函数g和组合定价(a)GAN调节函数g(SV-SV)(b)GAN调节函数g(SVI-SVI)(c)GAN组合定价(SVI-SVI)(d)UNC组合定价(SVI)该图显示了调节函数g的组成以及分类组合的平均回报与模型隐含平均回报。子图(a)显示g仅基于规模和价值,而子图(b)也包括投资。子图(c)和(d)显示了25个和35个分类投资组合的平均超额回报和模型隐含的横截面回归平均超额回报。调谐参数根据验证数据进行优化选择,与一般基准GAN不同。所有结果都是抽样评估的。C、 个股收益率横截面GAN SDF的样本外夏普比率较高,同时解释了比其他基准模型更多的变化和定价。表V报告了四种型号规格的三个主要性能指标,夏普比率、解释变量和横截面R。GAN的年度样本外夏普比约为2.6,几乎是简单预测法FFN的两倍。GAN能够捕获的非线性和相互作用结构与正则化线性模型相比增加了50%。因此,更灵活的形式很重要,但适当设计的线性模型已经可以实现令人印象深刻的性能。非正则线性模型在解释变量和定价误差方面表现最差。GAN解释了8%的个别股票收益变化,这是其他模型的两倍。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 09:42:28
类似地,横截面Rof 23%大大高于其他型号。有趣的是,基于无套利目标函数的正则化线性模型对股票收益的时间序列和横截面的解释至少与无套利条件下的灵活神经网络一样好。这里的每个模型都使用最优的超参数集来最大化验证夏普比率。在LS、EN和FFN的情况下,这意味着省略了宏观经济变量。基准标准与样本外测试和样本内培训数据不同。重要的是要记住,单个股票的风险溢价和风险敞口是随时间变化的。因此,根本没有理由期望不同时间窗口上的基准数字相同。然而,样本内数据中较高的基准数据表明存在一定程度的过度拟合。因此,相关指标是不同模型之间的相对样本外绩效,Martin和Nagel(2020)以及Gu、Kelly和Xiu(2020)也强调了这一点。表一:不同SDF车型的性能SSR EV XS RModel Train Valid Test Train Valid Test Train Valid Test Train Valid Test Train Valid Test Train TestLS 1.80 0.58 0.42 0.09 0.03 0.03 0.15 0.00 0.14EN 1.37 1.15 0.50 0.12 0.05 0.04 0.17 0.02 0.19FFN 0.45 0.42 0.44 0.11 0.04 0.04 0.04 0.14-0.00 0.15GAN 2.68 1.43 0.75 0.20 0.09 0.08 0.12 0.01 0.23此表显示了每月夏普SDF的E比率(SR),解释了GAN、FFN、EN和LS模型的时间序列变化(EV)和横截面平均值。图6总结了条件作用对隐藏的宏观经济状态变量的影响。首先,我们将178个宏观经济变量作为预测因子添加到所有网络中,而不将其还原为隐藏状态变量。LS、EN、FFN和GAN模型的样本外夏普比性能完全崩溃。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 09:42:32
首先,仅以宏观经济变量的最后一次规范化观测为条件(通常为增量),不允许检测动态结构,例如商业周期。夏普比率的衰减表明,仅使用过去的宏观经济信息会导致有价值信息的损失。更糟糕的是,与没有宏观经济信息的amodel相比,包括大量无关变量实际上会降低性能。尽管模型使用了一种正则化形式,但大量不相关的变量使得选择那些实际相关的变量变得更加困难。样本内培训数据的结果表明,当包含大量宏观经济变量时,完全过度拟合。没有宏观经济信息的FFN、EN和LS表现更好,这就是我们选择它们作为比较基准模型的原因。如果没有宏观经济,但只有特定的固定变量,则样本外夏普比率比宏观经济隐藏状态低10%左右。这是另一个迹象,表明将SDF权重归一化为kωk=1不会影响结果。解释的变化和定价结果基于每个时间步的横截面投影,该投影与任何缩放无关。Pesaran和Timmermann(1996)以及其他人显示了风险溢价的时间变化。图6:具有不同宏观经济变量的模型的性能该图显示了不同宏观经济信息包含的SDF的夏普比率。GAN(隐藏态)是我们的参考模型。UNC是我们模型的一个特殊版本,它只使用无条件矩(但在FFN网络中包含LSTM宏观经济状态,用于SDF权重)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 09:42:35
GAN(无宏观)、FFN(无宏观)、EN(无宏观)和LS(无宏观)仅使用固定的特定信息作为调节变量,而不使用宏观经济变量。GAN(所有宏)、FFN(所有宏)、EN(所有宏)和LS(所有宏)包括所有178个宏变量作为预测变量(分别是条件变量),而不使用LSTM将它们转换为宏观经济状态。这与包含时间序列的动态相关。UNC模型仅使用非条件矩作为目标函数,即使用常数条件函数g,但在因子权重中包含LSTM隐藏状态。夏普比比具有隐藏态的GaN低20%左右。这些结果证实了上一小节的见解。因此,重要的是不仅要在SDF的权重和负荷中包含所有特征和隐藏状态,还要在条件函数g中包含所有特征和隐藏状态,以确定对定价有影响的资产和时间。D、 预测绩效无套利因子表示法意味着股票的平均回报率与其通过β衡量的SDF风险敞口之间存在联系。基本方程et【Ret+1,i】=βt,iEt【Ft+1】意味着,只要条件风险溢价【Ft+1】为正(无风险要求),风险敞口βt较高的资产应具有较高的预期回报。我们通过根据风险负荷将股票分为十分之一的投资组合来检验模型的预测能力。在图7中,我们绘制了基于风险负荷β的十分位排序投资组合的累积超额回报。基于较高β的投资组合具有较高的后续回报。这清楚地表明,风险负荷预测未来的股票回报。特别是,最高和最低的十分位数显然是分开的。互联网附录收集了其他估算方法的相应结果,这些方法的结果在性质上相似,即。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 09:42:39
风险负荷预测未来回报。无套利条件不仅适用于图7之间的单调关系,而且还适用于图7之间的线性关系:十分位排序组合的累积超额收益与甘特图。该图显示了基于风险负荷β的十分位排序组合的累积超额收益。第一个投资组合基于最小的风险负荷十分之一,而最后一个十分之一的投资组合则基于最大的负荷十分之一。在每十分之一范围内,股票的权重相等。图8:β排序投资组合的预期超额收益与β的函数关系(a)5β排序的五分位数(b)10β排序的十分位数(c)20β排序的数量。该图显示了测试样本中GAN的β排序投资组合的预期超额收益。每个月将股票分为5、10或20个分位数。我们根据每个投资组合的β来绘制它们,平均每个投资组合中的单个股票βt、iover股票和时间。线性线表示带截距的线性回归,其Rof为0.98(五分位数)、0.97(十分位数)和0.95(20分位数)。SDF本身的β等于1。股票β和条件预期收益。无条件单因素模型(如CAPMCA)可以通过评估证券市场线的fit进行测试,即预期回报与资产β之间的关系。在我们的例子中,股票特定的βt是时变的,但通过构造,β排序的投资组合相对于SDF应该具有接近恒定的斜率。我们估计的载荷仅与SDFβt成比例。在每次t时,我们缩放载荷,使SDF投资组合的载荷为1。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 09:42:42
这相当于在不明确计算SDF的第二个条件矩的情况下获得正确缩放的βt。在图8中,我们绘制了10个β排序的十分位数以及5个和20个β排序的分位数组合相对于其平均β的预期超额回报。没有套利强加了线性关系和零截距。事实上,对于所有三个图,关系几乎完全线性,分别为0.98、0.97和0.95。然而,截距似乎略低于零。这表明了一个非常好但并不完美的fit。表二:β排序投资组合的时间序列定价错误平均回报率市场Rf Fama French 3 Fama French 5全面测试全面测试全面测试十分位数αtαtαtαtαtαtαt1-0.12-0.02-0.19-8.92-0.11-3.43-0.21-12.77-0.13-5.01-0.20-11.99-0.12-4.352-0.00 0.05-0.07-4.99-0.04-1.56-0.09-8.79-0.05-3.22-0.09-8.29-0.05 -2.683 0.04 0.08 -0.02 -2.01 -0.00 -0.16 -0.04 -5.18 -0.02 -1.40 -0.04 -4.87 -0.01 -1.054 0.07 0.09 -0.00 -0.03 0.01 0.68 -0.02 -2.30 -0.00 -0.35 -0.02 -2.86 -0.01 -0.545 0.10 0.12 0.03 2.75 0.04 2.50 0.01 2.08 0.03 2.46 0.01 1.36 0.03 2.176 0.11 0.12 0.04 3.16 0.05 2.77 0.02 2.75 0.03 2.85 0.01 1.51 0.02 2.207 0.14 0.15 0.07 5.62 0.07 3.92 0.05 6.61 0.05 4.39 0.04 5.16 0.04 3.418 0.18 0.18 0.11 7.41 0.10 5.12 0.08 9.32 0.08 5.83 0.07 8.05 0.07 4.869 0.22 0.21 0.15 7.83 0.13 5.37 0.11 9.16 0.11 5.71 0.11 8.58 0.11 5.3910 0.37 0.29 9.22 0.27 6.05 0.24 10.03 0.25 6.27 0.25 10.43 0.27 6.5910-1 0.48 0.39 0.47 18.93 0.38 10.29 0.45 18.50 0.38 10.14 0.46 18.13 0.39 9.96 GRS资产定价测试GRS p GRS p GRS p GRS p GRS p GRS p GRS p GRS p42.23 0.00 11.58 0.00 39.72 0.00 11.25 0.00 37.64 0.0010.75 0.00此表显示了基于GAN的β排序小数组合的平均回报率、时间序列定价错误和相应的t统计数据。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 09:42:47
定价错误基于CAPM和Fama-French 3和5因素模型。回报是按年计算的。GRS检验是在正确定价所有十分位投资组合的零假设下进行的,并包括p值。我们考虑全时期和测试期。在每十分之一范围内,股票的权重相等。β-排序投资组合的系统回报差异不能用市场因素解释。表II报告了三因素模型的10个十分位数排序投资组合的时间序列定价错误和相应的t统计量。显然,定价错误非常严重,几乎所有十分之一投资组合的预期收益都不能用法国因素来解释。GRS检验明确拒绝了一个无效假设,即任何一个因子模型都为该横截面定价。这些按β排序的投资组合对每个细分市场中的股票权重相等。互联网附录显示,这些发现扩展到了价值加权β排序的投资组合。E、 特征排序组合的定价我们的方法在标准测试组合上实现了前所未有的定价性能。资产定价测试通常在特征分类的投资组合上进行,这些投资组合将少数特征的定价效果隔离开来。我们根据这些特征将股票分为价值加权十分位和双重排序的25个投资组合。表A.III以四组十进制投资组合开始。我们选择短期反转和动量,因为这是两个最重要的因素。互联网附录收集了具有类似结果的其他特征类别的结果。这里我们只报告价值加权投资组合的结果。等权重投资组合的结果相似。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 09:42:51
未规范化线性模型的结果最差,可根据要求提供。下一节将讨论的重要变量以及规模和按市价分类的投资组合,这些都是经过充分研究的特征。GAN可以更好地捕捉短期反转和动量排序十分位投资组合的变化和平均回报。EN和FFN的性能非常相似。更好的GAN结果是通过解释极端十分投资组合(短期反转为10分之一,动量为1分之一)驱动的。对于中间投资组合,所有方法的形式都非常相似。事实证明,按市场销售的图书和按大小分类的文件夹很容易定价。所有模型的时间序列Rabove为70%,横截面Rclose为1。因此,所有模型似乎都能很好地捕捉到这一定价信息,尽管其结果仍略好于其他模型。表III:十分位数排序的投资组合的解释性变化和定价错误解释性变化横截面Rexplaned变化横截面RCharact。EN FFN GAN EN FFN GAN特征。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 09:42:54
EN FFN GAN EN FFN GANST版本0.43 0.58 0.70 0.45 0.79 0.94 Q 0.68 0.70 0.78 0.97 0.92 0.96SUV 0.42 0.75 0.83 0.64 0.97 0.99投资0.54 0.65 0.75 0.91 0.94 0.98r12 0.26 0.27 0.54 0.66 0.71 0.93 PM 0.52 0.42 0.68 0.90 0.86 0.93NOA 0.58 0.69 0.78 0.94 0.96 0.95 DPI2A 0.57 0.70 0.78 0.90 0.95 0.97SGA2S 0.52 0.63 0.73 0.93 0.95 0.96 ROE 0.59 0.56 0.76 0.91 0.86 0.97LME 0.83 0.78 0.86 0.96 0.950.97 S2P 0.69 0.79 0.82 0.98 0.98 0.97RNA 0.50 0.48 0.69 0.93 0.87 0.96 FC2Y 0.56 0.71 0.76 0.91 0.94 0.95L转换0.52 0.57 0.68 0.88 0.89 0.96 AC 0.63 0.79 0.82 0.96 0.98 0.98Lev 0.52 0.63 0.73 0.90 0.92 0.95 CTO 0.59 0.73 0.79 0.92 0.96 0.97Resid Var 0.52 0.27 0.65 0.84 0.73 0.97 LT版本0.60 0.59 0.72 0.93 0.85 0.94ROA 0.51 0.44 0.70 0.92 0.93 0.98 OP 0.56 0.48 0.74 0.97 0.88 0.98E2P 0.480.44 0.67 0.86 0.80 0.95 PROF 0.58 0.62 0.76 0.91 0.98 0.95D2P 0.47 0.51 0.72 0.82 0.85 0.94 IdioVol 0.43 0.27 0.66 0.79 0.72 0.97扩散0.49 0.32 0.60 0.76 0.71 0.92 r12 7 0.37 0.42 0.66 0.84 0.86 0.93CF2P 0.46 0.47 0.66 0.90 0.89 0.99 Beta 0.45 0.46 0.62 0.83 0.87 0.97BEME 0.70 0.75 0.82 0.97 0.94 0.98 OA 0.65 0.78 0.83 0.88 0.92 0.93方差0.48 0.27 0.61 0.74 0.72 0.90 ATO 0.58 0.70 0.770.96 0.98 0.99D2A 0.57 0.71 0.78 0.96 0.96 0.97 MktBeta 0.44 0.44 0.64 0.81 0.85 0.97PCM 0.66 0.79 0.82 0.97 0.98 0.99 OL 0.60 0.73 0.78 0.95 0.97 0.97A2ME 0.72 0.79 0.83 0.97 0.96 0.98 C 0.51 0.65 0.73 0.90 0.93 0.95 0.77 0.89 0.92 r36 13 0.54 0.53 0.69 0.92 0.82 0.93REL2高0.46 0.33 0.60 0.90 0.83 0.97镍0.51 0.60 0.75 0.88 0.96 0.99CF 0.61 0.64 0.78 0.89 0.85 0.96 r2 1 0.510.52 0.69 0.87 0.90 0.95此表显示了样本外解释的变化和46个十分位排序和价值加权投资组合的横截面RFR。表A.IV重复了对短期反转和动量双重排序以及规模和账面市值双重排序投资组合的相同分析。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 09:42:57
外卖类似于十分之一分类的Portfolios。GAN在动量相关投资组合上的表现优于FFN和EN,而这三个模型都能够解释双重排序投资组合的规模和价值。重要的是,在双排序反转和动量投资组合中,线性情况更糟。这是由于极端投资者的投资组合,尤其是低动量和高短期反转股票。这意味着线性模型无法捕捉特征之间的相互作用,而GaN模型成功识别了潜在的非线性相互作用效应。我们的发现推广到了其他十分位排序的投资组合。表III收集了解释的变量图9:价值加权特征排序组合的预测回报0.000 0.005 0.010 0.015 0.020超额回报0.0000.0050.0100.0150.020预计超额回报过去回报投资利润无形资产价值交易摩擦损失(a)GAN0.000 0.005 0.010 0.015 0.020超额回报0.0000.0050.0100.0150.020预计超额回报过去回报投资利润无形资产价值交易摩擦(b)FFN0.000 0.005 0.010 0.015 0.020超额回报0.0000.0050.0100.0150.020预计超额回报过往回报投资利润无形资产价值交易摩擦(c)EN0.000 0.005 0.015 0.020超额回报0.0050.0100.0150.020预计超额回报过往回报回报投资利润无形资产价值交易摩擦(d)1该图显示了四种SDF模型的价值加权特征排序十分位数组合的预测和平均超额回报。我们在六个不同的异常类别中总共有460个十分位数的投资组合。以及所有十分位排序投资组合的横截面RFR。令人惊讶的是,GAN在解释变异方面总是优于其他两个模型。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 09:43:00
同时,GAN的所有特性的横截面积均达到90%以上。在其他模型的横截面R略高的少数情况下,该数字非常接近1,即所有模型基本上都可以很好地解释十分位中的定价信息。综上所述,甘在解释分类投资组合的其他方法中占据着主导地位。结果表明:(1)非线性和相互作用matteras-GAN优于EN;(2)无套利条件提取附加信息asGAN优于FFN。图9显示了GAN解释所有价值加权特征排序十分位数的预期回报横截面的能力。我们绘制了平均超额收益和模型隐含平均超额收益。GAN SDF捕捉到了正确的单调行为,但其预测偏向于平均值。相比之下,其他三个模型的预测显示出更大的差异,这适用于所有群体的特征。图10显示了等权重十分位数投资组合的预测结果。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 09:43:03
所有模型的性能似乎都稍好一些,但总体结果是一样的。图10:等权特征排序组合的预测收益0.000 0.005 0.010 0.015 0.020 0.025超额收益0.0000.0050.0100.0150.0200.025预计超额收益过往收益投资利润率无形价值交易摩擦损失(a)GAN0.000 0.005 0.010 0.015 0.020 0.025超额收益0.0050.0000.0050.0100.0150.0200.025预计超额收益过往收益回报投资利润无形资产价值交易摩擦(b)FFN0.000 0.005 0.010 0.015 0.020 0.025超额回报0.0050.0000.0050.0100.0150.0200.025预计超额回报过往回报投资利润无形资产价值交易摩擦(c)EN0.000 0.005 0.010 0.015 0.020 0.025超额回报0.0050.0000.0050.0100.0200.025预计超额回报过往回报回报投资利润无形价值贸易摩擦(d)1该图显示了四种SDF模型的等权特征排序十分位数投资组合的预测和平均超额回报。我们在六个不同的异常类别中总共有460个十分位数的投资组合。F、 变量重要性SDF因子的结构是什么?作为表a.V中的第一步,我们将GANfactor与Fama-French 5因子模型进行比较。五个因素中没有一个与我们的因素高度相关,而稳定性因素的相关性最高,为17%。市场因素的相关性仅为10%。接下来,我们运行一个时间序列回归,用Fama French 5因子解释GAN因子组合。只有稳定性因素才重要。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 09:43:07
stronglysigni ficant定价错误表明,这些因素无法捕获我们SDF投资组合中的定价信息。我们根据SDF权重ω对这些变量的敏感性,对定价核心的企业特定变量和宏观经济变量的重要性进行排序。我们的敏感性分析与Sirignano、Sadhwani和Giesecke(2020)以及Horel和Giesecke(2020)相似,并基于平均绝对梯度。更具体地说,我们将一个特定变量的灵敏度定义为权重w相对于该变量的平均绝对导数:灵敏度(xj)=CNXi=1TXt=1w(It,It,i)xj公司,其中C是归一化常数。这简化了线性回归框架特殊情况下的标准斜率系数。更大的灵敏度意味着变量对SDF权重ω的影响更大。图11:GAN SDF0.000 0.005 0.010 0.015 0.020 0.025 0.030 0.035 0.040ST\\u REVSUVr12\\u 2oasga2slernalturnsoverlevreside\\u varroae2pd2spreadscf2bemevarianced2apcma2meatrell2highcfqinvestmentpmdpi2areos2pfc2yacctolt\\u revopportofidiovolr12\\u 7etoaatomketbetalcr36\\u 13NIr2\\u 1fast returnsinvestinvestmentprofitable无形价值交易摩擦图中显示了GAN根据测试数据的平均绝对梯度(VI),对46个具体特征进行可变重要性排序。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 09:43:10
这些值被规范化为总和为1。图12:FFN SDF0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08ST\\u REVSUVr12\\u 2LMEr2\\u 1turnoverbetall2highcf2predic\\u varidiovolfc2yvariancespreadtpmatrnaroar12\\u 7a2mebeme2ps2pr36\\u 13QD2PSGA2SLT\\u Revdpi2niolpcmreotoprofoapctonoinvestmentmktbetalecd2cfcover returnsinvestmentprofitabilityintablesvtrading flictionscategory图显示FFN变量根据测试数据的平均绝对梯度(VI),对46个具体特征进行重要性排序。这些值被规范化为总和为1。图11对GAN的46个特定特征的变量重要性进行了排序。将所有灵敏度之和归一化为1。图12、A.5和A.6收集了FFN、EN和LS的相应结果。GAN、FFN和EN三种模型都选择交易摩擦和过去收益率作为最相关的类别。GAN最重要的变量是短期反转(ST-REV)、标准未解释体积(SUV)和动量(r12-2)。重要的是,对于GAN而言,前20个变量中包含了所有6个类别,其中包括价值、无形资产、投资和可盈利性特征。FNN的SDF构成有所不同,前14个特征几乎只存在于交易摩擦和过往回报类别中。更具体地说,该SDF严重依赖于短期逆转、以无法解释的交易量和规模衡量的流动性不足,这引发了人们的怀疑,即简单的预测方法可能主要关注流动性不足的低价股。具有信息性测试资产的无套利条件似乎有必要约束模型,以捕获其他特征中的定价信息。图A.7显示了条件向量g的变量重要性排序。GAN测试资产取决于所有六个主要异常类别。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 09:43:13
这些测试资产确保GAN SDF也反映了这些信息。带有正则化的线性模型还从前9个变量中的所有六个类别中选择变量。请注意,弹性净惩罚去除了紧密替代的特征,例如,由于股息价格比(D2P)和账面市值比(BEME)捕获了相似的信息,正则化模型仅选择其中一个。没有正则化的线性模型无法处理大量的变量,因此不令人惊讶的是,会产生不同的排名。图A.4显示了宏观经济变量对GAN模型的重要性。在输入SDF权重之前,这些变量首先被总结为四个隐藏状态过程。首先,很明显,大多数宏观经济变量具有非常相似的重要性。这与宏观经济时间序列之间存在强烈依赖关系的模型一致,宏观经济时间序列由低维非线性因素结构驱动。一个简单的例子是Ludvigson和Ng(2009)中的因子模型,其中宏观经济数据集中的信息与我们的数据非常相似,由少量PCA因子总结。由于第一个主成分分析因子可能会呈现总体经济市场趋势,因此会影响所有变量。如果SDF结构取决于PCA因素,则所有宏观经济变量似乎都很重要(具有潜在的相似程度)。重要的是要记住,对宏观经济变量进行简单的主成分分析在我们的资产定价环境中不起作用。原因是PCA因素主要基于宏观经济时间序列的增量,因此无法捕捉动态模式。在我们的重要链接中,最相关的两个变量是中间的买卖价差(价差)和联邦基金利率(FEDFUNDS)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 09:43:16
这些可以解释为捕捉整体经济活动水平和整体市场波动。我们表明,隐藏的宏观经济状态与商业周期和总体经济活动密切相关。图13绘制了四个隐藏的宏观经济状态变量的时间序列。这些变量是对宏观经济信息历史进行编码的LSTM的输出。基于PCA的宏观经济因素的结果可根据要求提供。我们还想澄清,对于其他应用,基于宏观经济时间序列的基于主成分分析的因素实际上可能捕获相关信息。图13:宏观经济隐藏状态过程(LSTM输出)。该图显示了在GAN模型中使用LSTM提取的四个宏观经济隐藏状态过程。灰色区域标志着NBER的衰退期。时间序列是多重集合估计中的一种代表性估计。信息。在这里,我们从九个集合估计中报告了一个具有代表性的LSTM。灰色阴影区域表示NBER衰退。首先,很明显,国家变量,特别是第三和第四个国家的变量,在衰退时期达到峰值。其次,状态过程似乎具有周期性行为,这证实了我们的直觉,即相关宏观经济信息可能与商业周期相关。不同教学集合的周期和峰值返回状态过程的四维向量。然而,平均这些向量没有意义,因为一个fit中的第一状态过程不需要对应于另一个fit中的相同过程。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群