全部版块 我的主页
论坛 经济学人 二区 外文文献专区
1147 22
2022-05-06
英文标题:
《A Multi-factor Adaptive Statistical Arbitrage Model》
---
作者:
Wenbin Zhang, Zhen Dai, Bindu Pan, Milan Djabirov
---
最新提交年份:
2014
---
英文摘要:
  This paper examines the implementation of a statistical arbitrage trading strategy based on co-integration relationships where we discover candidate portfolios using multiple factors rather than just price data. The portfolio selection methodologies include K-means clustering, graphical lasso and a combination of the two. Our results show that clustering appears to yield better candidate portfolios on average than naively using graphical lasso over the entire equity pool. A hybrid approach of using the combination of graphical lasso and clustering yields better results still. We also examine the effects of an adaptive approach during the trading period, by re-computing potential portfolios once to account for change in relationships with passage of time. However, the adaptive approach does not produce better results than the one without re-learning. Our results managed to pass the test for the presence of statistical arbitrage test at a statistically significant level. Additionally we were able to validate our findings over a separate dataset for formation and trading periods.
---
中文摘要:
本文研究了基于协整关系的统计套利交易策略的实现,其中我们使用多个因素而不仅仅是价格数据来发现候选投资组合。投资组合选择方法包括K均值聚类、图形套索以及两者的组合。我们的结果表明,在整个股票池中,聚类似乎平均比单纯使用图形套索产生更好的候选投资组合。将图形套索和聚类结合使用的混合方法仍能产生更好的结果。我们还通过重新计算潜在投资组合一次,以考虑随着时间推移关系的变化,来检验交易期间适应性方法的效果。然而,自适应方法并不比不进行再学习的方法产生更好的结果。我们的结果在统计显著水平上通过了统计套利测试。此外,我们能够通过一个单独的数据集验证我们的发现,包括形成期和交易期。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Portfolio Management        项目组合管理
分类描述:Security selection and optimization, capital allocation, investment strategies and performance measurement
证券选择与优化、资本配置、投资策略与绩效评价
--
一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-5-6 05:09:30
一个多因素自适应统计套利模型——张文斌、戴珍、潘彬都和米兰·贾比罗夫特佩尔商学院,卡内基梅隆大学布罗德街55号,纽约,NY 10005 USA摘要本文研究了一种基于协整关系的统计套利交易策略的实施情况,在这种策略中,我们使用多个因素而不仅仅是价格数据来发现候选投资组合。投资组合选择方法包括K-均值聚类、图形套索和二者的组合。我们的结果表明,与单纯地在整个股票池中使用图形套索相比,平均而言,聚类似乎能产生更好的候选投资组合。将图形套索和聚类结合使用的混合方法仍能产生更好的结果。我们还通过重新计算一次潜在的投资组合,以解释随着时间推移关系的变化,来检验交易期间适应性方法的效果。然而,自适应方法不会产生比无需重新学习的方法更好的结果。我们的结果在统计显著性水平上通过了统计学比特率检验。此外,我们能够在一个单独的数据集上验证我们的发现,以确定形成期和交易期。介绍过去发表的探索协整和配对交易的论文,通过发现那些价格在历史上同步变动的股票,来识别“类似”股票的投资组合。我们认为,在协整的情况下,这个过程可以通过寻找“相似”的股票而不是仅仅通过价格来改善,因为特征相似的公司的股票价格或多或少会一起移动。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 05:09:33
直觉是,如果我们能够识别出在多个维度上相似的投资组合,那么它们的线性组合(在价格上)在任何暂时的分歧之后,都更有可能恢复为协整。通过增加额外的维度,在选择过程中注入更多信息,以便在未来的价格变动中确定更强的关系,似乎值得探索。与图形套索相比,另一种机器学习技术——聚类是使用的自然选择。在简要浏览了有关协整、配对交易和其他统计套利方法的已发表文献后,我们没有发现任何其他人尝试这个概念。开发统计套利的三个主要组成部分是确定交易的正确资产、通过反向测试模拟交易,以及验证统计套利的存在。下面是我们对这些要素的研究概述。第一部分,选择过程,突出了我们的大部分努力:  因素选择:我们使用PCA技术来确定一组独立的因素。我们使用了这些因素本身以及这些原始因素的线性组合,这些原始因素是通过PCALOADING计算出来的。  聚类:我们使用K-均值聚类。通讯作者。电子邮件地址:wenbinz@tepper.cmu.edu.  结合聚类和图形套索。我们提出了两种不同的方法——“聚类Glasso”和“Glasso聚类”。对于第二部分,我们遵循标准策略套利交易程序:  我们测试了每个确定的投资组合的协整关系。  我们检查了投资组合在形成期间是否产生了正利润。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 05:09:36
如果是这样,我们继续交易这些投资组合。  我们试图在交易阶段重新平衡策略,以考虑集群和协整关系可能会随着时间的推移而变化。最后,我们使用基于JTTW的方法来测试交易结果,并交叉验证我们的策略。数据收集和标准化我们的原始数据主要来自彭博社。我们根据基础、统计和动量相关因素选择了19个不同维度。该数据集涵盖了从2004年第一个交易日到2011年最后一个交易日期间标普500指数的所有美国股票。我们最初考虑的维度是:波动性(60天)股票未完成销售增长RSI(相对强度指数)价格与账面比率价格与销售比率价格与息税折旧摊销前利润比率/E合理化ROE市场资本自由现金流增长现金流增长股息(每股)彭博估计分析师评级卖出建议总数与买入建议总数Sprice(closeAskBidWe通过删除所有非交易日和缺失值来清理初始原始数据集。在整个期间,共有109只股票在所有19个维度上都没有缺失值。我们的实施是基于这些股票。我们注意到,选择2004年的标准普尔500指数股票,并加强我们处理缺失基本面数据的方法,可能更合适在不同的形成时期。不幸的是,我们没有获得获取这些数据的手段。这有可能引入幸存者偏见。关于数据选择和潜在偏差的单独章节在本文后面再次讨论了这个问题。接下来,在应用任何附加过滤之前,我们规范化了所有维度。买入/卖出建议的数量被合并为一个单一因素(买入/卖出)/(买入+卖出)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 05:09:39
我们还计算了市值和流通股数量的对数。这一步的动机是Axtell,他指出,美国公司规模在对数标度(排名与频率)上绘制时,表现出类似Zipf定律的分布。然后通过减去平均值并除以样本标准偏差,对因子进行归一化。我们的日期集将分为两部分:  常规实验阶段:2004年1月至2007年12月。前两年是信息期,后两年是交易期。  交叉验证阶段:从2008年1月到2011年12月。前两年是信息期,后两年是交易期。PCA分析为了选择影响最大的因素,我们对标准化数据应用了PCA。下图显示了结果分析:根据载荷的输出,我们确定了7个最重要的组成部分对95的贡献。总差异的5%。鉴于这些数据,我们使用了两种不同的方法进行因子选择。基于主成分分析产生的独立主成分,选择最重要的原始因子,我们可以很容易地观察到对我们的数据方差起主要作用的维度。在这种情况下,我们没有直接使用线性组合。7个最重要的因素是:市盈率价格与销售额比率现金流量增长价格价格与息税折旧摊销前利润比率进化选择PCAWe产生的主成分也直接选择了7个最重要的主成分进行分析。在接下来的结果中,我们基于这两种选择方法运行了聚类算法。K-均值聚类有许多常用的聚类算法。我们觉得,就我们的目的而言,最具启发性的选择是K均值聚类。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 05:09:42
为了在形成期间为每个集群生成合理的大小,我们选择了K=30,这似乎可以生成平均约2-4个股票的集群大小。候选投资组合生成为了使每种选择方法的投资组合规模具有可比性,我们实施了每个投资组合2-4只股票的政策。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群