全部版块 我的主页
论坛 经济学人 二区 外文文献专区
1056 10
2022-05-09
英文标题:
《Using machine learning for medium frequency derivative portfolio trading》
---
作者:
Abhijit Sharang and Chetan Rao
---
最新提交年份:
2015
---
英文摘要:
  We use machine learning for designing a medium frequency trading strategy for a portfolio of 5 year and 10 year US Treasury note futures. We formulate this as a classification problem where we predict the weekly direction of movement of the portfolio using features extracted from a deep belief network trained on technical indicators of the portfolio constituents. The experimentation shows that the resulting pipeline is effective in making a profitable trade.
---
中文摘要:
我们使用机器学习为5年期和10年期美国国债期货组合设计中频交易策略。我们将其描述为一个分类问题,其中我们使用从深度信念网络中提取的特征预测投资组合每周的运动方向,该网络根据投资组合组成部分的技术指标进行训练。实验表明,由此产生的管道可以有效地进行有利可图的交易。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Trading and Market Microstructure        交易与市场微观结构
分类描述:Market microstructure, liquidity, exchange and auction design, automated trading, agent-based modeling and market-making
市场微观结构,流动性,交易和拍卖设计,自动化交易,基于代理的建模和做市
--
一级分类:Computer Science        计算机科学
二级分类:Machine Learning        机器学习
分类描述:Papers on all aspects of machine learning research (supervised, unsupervised, reinforcement learning, bandit problems, and so on) including also robustness, explanation, fairness, and methodology. cs.LG is also an appropriate primary category for applications of machine learning methods.
关于机器学习研究的所有方面的论文(有监督的,无监督的,强化学习,强盗问题,等等),包括健壮性,解释性,公平性和方法论。对于机器学习方法的应用,CS.LG也是一个合适的主要类别。
--
一级分类:Statistics        统计学
二级分类:Machine Learning        机器学习
分类描述:Covers machine learning papers (supervised, unsupervised, semi-supervised learning, graphical models, reinforcement learning, bandits, high dimensional inference, etc.) with a statistical or theoretical grounding
覆盖机器学习论文(监督,无监督,半监督学习,图形模型,强化学习,强盗,高维推理等)与统计或理论基础
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-5-9 17:16:12
使用机器学习进行中频衍生品投资组合交易Bahijit Sharang斯坦福大学计算机科学系邮件:abhisg@stanford.eduChetanRaoStanford大学Net flix Inc.电子邮件:chetanr@stanford.eduAbstract-我们使用机器学习为5年期和10年期美国国债期货的投资组合设计中频交易策略。我们将其描述为一个分类问题,我们使用从深度信念网络中提取的特征预测投资组合每周的运动方向,该网络根据投资组合组成部分的技术指标进行培训。实验表明,由此产生的管道在利润贸易中是有效的。I.由于低信噪比,介绍和相关的工作机器学习在金融领域的应用是一个具有挑战性的问题。此外,领域专业知识对于帮助解决适当分类或回归问题的工程特性至关重要。该领域的大部分前期工作集中于使用支持向量机[7]、[12]、[9]和神经网络[8]、[3]、[13]等流行技术,并结合严格设计的特征,通常的重点领域是金融时间序列预测。通过深入学习技术,我们可以了解原始特征的潜在表征,并使用这种表征进行进一步分析[2]。在本文中,我们构建了一个5年期和10年期国债期货的最小风险组合,并使用机器学习管道,使用来自深度信念网络的特征预测投资组合的每周移动方向。然后,管道中的预测将用于日交易策略。使用衍生工具而不是基础实体本身会导致一个更可行的问题,因为衍生工具的波动性较小,因此具有更清晰的模式。论文的其余部分分为四个部分。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 17:16:16
在第2节中,我们描述了数据集和原始特征。第3节严格讨论了方法论。在第4节中,我们重点介绍了实验结果。最后,我们总结了该管道中可能的改进。二、数据集和原始特征我们使用从quandl获得的5年期和10年期美国国债期货(短代码分别为ZF和ZN)的数据。我们有1985年的每日数据,其中每个数据行包括开盘价、收盘价、高价、低价、开盘利率和交易量。请注意,所有这些价格都是中间价,因此不考虑投标报价。我们执行其余分析的价格作为开盘价和收盘价的中间价thehttps://www.quandl.com/data/CMEhttps://www.cmegroup.com/education/文件/了解国库未来。ZF和ZN的PDFC价格均下跌。这使得我们无法以高于当日单笔交易的频率进行交易,但简化了分类。图1显示了采埃孚和锌的历史价格演变。正如预期的那样,从长期来看,债券市场会上升,但相对价差的漂移最小。图1:每日仪器价格系列在2008年金融危机期间删除了包含缺失信息和一些高杠杆率点的行之后,我们总共留下了约6000个数据点。我们使用80%的数据进行培训,接下来10%的数据作为验证集,其余10%的数据用于测试目的。我们不进行k倍验证,因为我们只对历史模型在新数据上的表现感兴趣。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 17:16:19
正面和负面示例(如下所述)的数量在训练集为2325和2608,在验证集为280和310,在测试集为295和315。我们的原始特征包括过去一周计算的每日趋势(当前价格移动平均值),以及采埃孚和锌的每周和双周移动平均值。因此,我们有5×2×2=20个原始特征。我们对这些特征进行最小-最大标准化,以供以后分析。对于每个数据点,如果投资组合价格(定义见下文)从现在起上涨5天,我们将标签与+1关联,否则将标签与-1关联。三、 方法学下面的流程图显示了策略的完整流程。下面是组件方面的描述。过滤端口组合自然跟踪RBMs分类——ZFRAWZNRAWZNORMZNORM??ypred(k* 采埃孚- K* ZN)f(ZF,ZN)?f(ZF,ZN)图2:战略的ML管道。投资组合构造为了获得投资组合的每日价格序列,我们对ZF和ZN的价格序列使用主成分分析(PCA)。主成分分析将高维空间中的数据转换为等维或低维空间,基向量按方差百分比排序,方差百分比由数据沿它们的投影解释。由于国债衍生品对利率的依赖程度很高,因此数据中约99%的差异由第一个主要成分解释。因此,在实践中,第二主成分的荷载在长时间计算时保持相当恒定。此外,我们观察到组合价格序列的平稳性,这意味着组合的风险最小。因此,Pport=P C25yr* P5年+P C210年* P10yr,其中P C25YR和P C210YR预计将保持相反的符号。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 17:16:23
随后,每当我们对投资组合进行单单位交易时,我们都会根据第二个组成部分的负荷量,对其中一个期货做多,对另一个期货做空。这确保了我们在投资组合的两个分支中的头寸得到对冲。图3显示了整个数据的每日投资组合价格序列。观察价格系列的漂移成分几乎可以忽略不计。B.特征生成为了提取从仪器中提取的原始特征的潜在表示,我们使用了一个深度信念网络(DBN),该网络由堆叠的受限Boltzmann机器组成。玻尔兹曼机器是一种基于能量的模型,其中能量是自由参数的线性函数。受限玻尔兹曼机器(RBM)由一层可见单元和一层隐藏单元的二部图组成,可用于学习输入上的概率分布。RBM的两个层次共享权重,使用对比发散算法学习权重[5]。DBN modelshttp://deeplearning.net/tutorial/rbm.htmlFig.3:组合每日价格系列(x,h,…,h`)=Q`-2k=0P(hk | hk+1)P(h)`-1,h`),其中x=h,P(hk-1 | hk)是以k级RBM的隐藏单位为条件的可见单位和P(h)的条件分布`-1,h`)是顶层RBM中可见的隐藏关节分布(见图4)。在我们的管道中,信念网络由两个RBM组成,其中第一个RBM是高斯-伯努利,第二个RBM是伯努利。在业绩预测中,这两种RBM都应该是连续的(高斯是一种特例),但训练这些RBM非常困难[4]。实际上,仅在第一个可见单元中使用连续输入似乎对我们的应用程序来说是足够的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 17:16:27
我们使用[6]中提出的标准算法,该算法包括贪婪地对每个RBM进行对比发散,以学习重构权重矩阵,并将转换后的输入传递给下一个RBM。DBN的输出是由相应的伯努利分布导出的原始输入特征的二进制最新表示。图4:代表性DBNC。微调和分类然后使用特征的潜在表示为上述预测目标构建分类器。我们试验了三种分类法。采用fromhttp://www.iro.umontreal.ca/~ lisa/twiki/bin/view。cgi/Public/DeepBeliefNetworkso逻辑回归——在逻辑回归中,我们建模p(yi | xi)=φ(xi)1+y(1- φ(xi))1-yandφ(xi)=1+exp(-θTxi),并最大化输入的对数可能性。为了防止过度拟合,通常负脊惩罚也与目标函数相关支持向量机——支持向量机通过最小化| | w | | | CP来构造超平面wTφ(x)+b=0来区分数据依附于易(wTφ(xi)+b)≥1.- 我我≥ 0 i、 其中φ(xi)是xior或xi的高维表示。在任何一种情况下,它都不需要显式计算,因为(wTφ(x)+b)可以通过“核技巧”进行分类,因为它是几个φ(xi)的线性组合,这些φ(xi)被称为支持向量神经网络——神经网络由一个输入层、几个隐藏的节点层(通常为1或2)和一个输出层组成,节点数等于类别的中心度。它最小化了mXi=1(yi- ^yi),其中^yi=h(g(xi)),g是网络隐藏层中的节点值和h isan激活函数(通常为S形函数或双曲函数)的线性组合。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群