利用机器学习进行中频衍生品组合交易

1159

收藏 2022-05-09

英文标题：
《Using machine learning for medium frequency derivative portfolio trading》
---
作者：
Abhijit Sharang and Chetan Rao
---
最新提交年份：
2015
---
英文摘要：
We use machine learning for designing a medium frequency trading strategy for a portfolio of 5 year and 10 year US Treasury note futures. We formulate this as a classification problem where we predict the weekly direction of movement of the portfolio using features extracted from a deep belief network trained on technical indicators of the portfolio constituents. The experimentation shows that the resulting pipeline is effective in making a profitable trade.
---
中文摘要：
我们使用机器学习为5年期和10年期美国国债期货组合设计中频交易策略。我们将其描述为一个分类问题，其中我们使用从深度信念网络中提取的特征预测投资组合每周的运动方向，该网络根据投资组合组成部分的技术指标进行训练。实验表明，由此产生的管道可以有效地进行有利可图的交易。
---
分类信息：

一级分类：Quantitative Finance 数量金融学
二级分类：Trading and Market Microstructure 交易与市场微观结构
分类描述：Market microstructure, liquidity, exchange and auction design, automated trading, agent-based modeling and market-making
市场微观结构，流动性，交易和拍卖设计，自动化交易，基于代理的建模和做市
--
一级分类：Computer Science 计算机科学
二级分类：Machine Learning 机器学习
分类描述：Papers on all aspects of machine learning research (supervised, unsupervised, reinforcement learning, bandit problems, and so on) including also robustness, explanation, fairness, and methodology. cs.LG is also an appropriate primary category for applications of machine learning methods.
关于机器学习研究的所有方面的论文（有监督的，无监督的，强化学习，强盗问题，等等），包括健壮性，解释性，公平性和方法论。对于机器学习方法的应用，CS.LG也是一个合适的主要类别。
--
一级分类：Statistics 统计学
二级分类：Machine Learning 机器学习
分类描述：Covers machine learning papers (supervised, unsupervised, semi-supervised learning, graphical models, reinforcement learning, bandits, high dimensional inference, etc.) with a statistical or theoretical grounding
覆盖机器学习论文（监督，无监督，半监督学习，图形模型，强化学习，强盗，高维推理等）与统计或理论基础
--

---
PDF下载：
-->

Using_machine_learning_for_medium_frequency_derivative_portfolio_trading.pdf
大小:(550.43 KB)

马上下载

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

kedemingshi

2022-5-9 17:16:12

使用机器学习进行中频衍生品投资组合交易Bahijit Sharang斯坦福大学计算机科学系邮件：abhisg@stanford.eduChetanRaoStanford大学Net flix Inc.电子邮件：chetanr@stanford.eduAbstract-我们使用机器学习为5年期和10年期美国国债期货的投资组合设计中频交易策略。我们将其描述为一个分类问题，我们使用从深度信念网络中提取的特征预测投资组合每周的运动方向，该网络根据投资组合组成部分的技术指标进行培训。实验表明，由此产生的管道在利润贸易中是有效的。I.由于低信噪比，介绍和相关的工作机器学习在金融领域的应用是一个具有挑战性的问题。此外，领域专业知识对于帮助解决适当分类或回归问题的工程特性至关重要。该领域的大部分前期工作集中于使用支持向量机[7]、[12]、[9]和神经网络[8]、[3]、[13]等流行技术，并结合严格设计的特征，通常的重点领域是金融时间序列预测。通过深入学习技术，我们可以了解原始特征的潜在表征，并使用这种表征进行进一步分析[2]。在本文中，我们构建了一个5年期和10年期国债期货的最小风险组合，并使用机器学习管道，使用来自深度信念网络的特征预测投资组合的每周移动方向。然后，管道中的预测将用于日交易策略。使用衍生工具而不是基础实体本身会导致一个更可行的问题，因为衍生工具的波动性较小，因此具有更清晰的模式。论文的其余部分分为四个部分。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

能者818

2022-5-9 17:16:16

在第2节中，我们描述了数据集和原始特征。第3节严格讨论了方法论。在第4节中，我们重点介绍了实验结果。最后，我们总结了该管道中可能的改进。二、数据集和原始特征我们使用从quandl获得的5年期和10年期美国国债期货（短代码分别为ZF和ZN）的数据。我们有1985年的每日数据，其中每个数据行包括开盘价、收盘价、高价、低价、开盘利率和交易量。请注意，所有这些价格都是中间价，因此不考虑投标报价。我们执行其余分析的价格作为开盘价和收盘价的中间价thehttps://www.quandl.com/data/CMEhttps://www.cmegroup.com/education/文件/了解国库未来。ZF和ZN的PDFC价格均下跌。这使得我们无法以高于当日单笔交易的频率进行交易，但简化了分类。图1显示了采埃孚和锌的历史价格演变。正如预期的那样，从长期来看，债券市场会上升，但相对价差的漂移最小。图1：每日仪器价格系列在2008年金融危机期间删除了包含缺失信息和一些高杠杆率点的行之后，我们总共留下了约6000个数据点。我们使用80%的数据进行培训，接下来10%的数据作为验证集，其余10%的数据用于测试目的。我们不进行k倍验证，因为我们只对历史模型在新数据上的表现感兴趣。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

mingdashike22

2022-5-9 17:16:19

正面和负面示例（如下所述）的数量在训练集为2325和2608，在验证集为280和310，在测试集为295和315。我们的原始特征包括过去一周计算的每日趋势（当前价格移动平均值），以及采埃孚和锌的每周和双周移动平均值。因此，我们有5×2×2=20个原始特征。我们对这些特征进行最小-最大标准化，以供以后分析。对于每个数据点，如果投资组合价格（定义见下文）从现在起上涨5天，我们将标签与+1关联，否则将标签与-1关联。三、方法学下面的流程图显示了策略的完整流程。下面是组件方面的描述。过滤端口组合自然跟踪RBMs分类——ZFRAWZNRAWZNORMZNORM？？ypred（k* 采埃孚- K* ZN）f（ZF，ZN）？f（ZF，ZN）图2：战略的ML管道。投资组合构造为了获得投资组合的每日价格序列，我们对ZF和ZN的价格序列使用主成分分析（PCA）。主成分分析将高维空间中的数据转换为等维或低维空间，基向量按方差百分比排序，方差百分比由数据沿它们的投影解释。由于国债衍生品对利率的依赖程度很高，因此数据中约99%的差异由第一个主要成分解释。因此，在实践中，第二主成分的荷载在长时间计算时保持相当恒定。此外，我们观察到组合价格序列的平稳性，这意味着组合的风险最小。因此，Pport=P C25yr* P5年+P C210年* P10yr，其中P C25YR和P C210YR预计将保持相反的符号。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

nandehutu2022

2022-5-9 17:16:23

随后，每当我们对投资组合进行单单位交易时，我们都会根据第二个组成部分的负荷量，对其中一个期货做多，对另一个期货做空。这确保了我们在投资组合的两个分支中的头寸得到对冲。图3显示了整个数据的每日投资组合价格序列。观察价格系列的漂移成分几乎可以忽略不计。B.特征生成为了提取从仪器中提取的原始特征的潜在表示，我们使用了一个深度信念网络（DBN），该网络由堆叠的受限Boltzmann机器组成。玻尔兹曼机器是一种基于能量的模型，其中能量是自由参数的线性函数。受限玻尔兹曼机器（RBM）由一层可见单元和一层隐藏单元的二部图组成，可用于学习输入上的概率分布。RBM的两个层次共享权重，使用对比发散算法学习权重[5]。DBN modelshttp://deeplearning.net/tutorial/rbm.htmlFig.3：组合每日价格系列（x，h，…，h`）=Q`-2k=0P（hk | hk+1）P（h）`-1，h`），其中x=h，P（hk-1 | hk）是以k级RBM的隐藏单位为条件的可见单位和P（h）的条件分布`-1，h`）是顶层RBM中可见的隐藏关节分布（见图4）。在我们的管道中，信念网络由两个RBM组成，其中第一个RBM是高斯-伯努利，第二个RBM是伯努利。在业绩预测中，这两种RBM都应该是连续的（高斯是一种特例），但训练这些RBM非常困难[4]。实际上，仅在第一个可见单元中使用连续输入似乎对我们的应用程序来说是足够的。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

大多数88

2022-5-9 17:16:27

我们使用[6]中提出的标准算法，该算法包括贪婪地对每个RBM进行对比发散，以学习重构权重矩阵，并将转换后的输入传递给下一个RBM。DBN的输出是由相应的伯努利分布导出的原始输入特征的二进制最新表示。图4：代表性DBNC。微调和分类然后使用特征的潜在表示为上述预测目标构建分类器。我们试验了三种分类法。采用fromhttp://www.iro.umontreal.ca/~ lisa/twiki/bin/view。cgi/Public/DeepBeliefNetworkso逻辑回归——在逻辑回归中，我们建模p（yi | xi）=φ（xi）1+y（1- φ（xi））1-yandφ（xi）=1+exp(-θTxi），并最大化输入的对数可能性。为了防止过度拟合，通常负脊惩罚也与目标函数相关支持向量机——支持向量机通过最小化| | w | | | CP来构造超平面wTφ（x）+b=0来区分数据依附于易（wTφ（xi）+b）≥1.- 我我≥ 0 i、其中φ（xi）是xior或xi的高维表示。在任何一种情况下，它都不需要显式计算，因为（wTφ（x）+b）可以通过“核技巧”进行分类，因为它是几个φ（xi）的线性组合，这些φ（xi）被称为支持向量神经网络——神经网络由一个输入层、几个隐藏的节点层（通常为1或2）和一个输出层组成，节点数等于类别的中心度。它最小化了mXi=1（yi- ^yi），其中^yi=h（g（xi）），g是网络隐藏层中的节点值和h isan激活函数（通常为S形函数或双曲函数）的线性组合。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

能者818

2022-5-9 17:16:30

训练一个神经网络，包括使用梯度下降将上述定义的均方误差（MSE）最小化，并将梯度反向传播到多个隐藏层，以更新节点之间的权重。在这里，我们不是随机初始化神经网络，而是使用在深度信念网络中学习的重建权重来形成一个具有两个隐藏层的神经网络。四、实验和结果a。投资组合权重我们通过标准化锌和锌的原始价格序列，对训练数据进行主成分分析。我们使用训练的平均值和标准差来标准化验证和测试的原始价格序列，以便分别计算PCA。在训练中，ZF的第二个部件载荷为0.83，ZN为-0.59，验证集为0.76和-0.62，测试为0.81和-0.6。验证集加载证实了投资组合风险最小的假设。我们在训练、验证和测试集中使用训练负载，为我们的监督学习算法生成标签。B.培训模型培训分两个阶段。在第一阶段，以无监督的方式学习BN参数，在第二阶段，使用监督学习对分类参数进行微调。1） DBN训练：在我们的算法中，信念网络的目的是学习所用特征的隐藏表示。使用[1]中的建议，我们创建了一组2个RBM，第一个RBM在隐藏层中包含15个节点，第二个RBM在隐藏层中包含20个节点。在python中实现的对比发散算法中，每个RBM都经过100次迭代的训练，最小批量为100次。由于价格序列中的相邻数据点有相互关联的趋势，我们在每次宏观迭代开始时都会显示训练数据。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

kedemingshi

2022-5-9 17:16:33

所有超参数，包括隐藏层中的节点大小，都是通过监视验证集上的AveragerConstruction错误来选择的。图5显示了训练集和验证集上最佳超参数集的重构误差演化。图5：信念网络中两个堆叠RBMs的重建MSE与时代2）监督学习：我们通过梯度下降优化神经网络参数，通过梯度上升优化逻辑回归参数。算法使用的最佳纪元数由验证集上的性能决定。对于支持向量机，我们使用验证集优化成本参数C。我们使用scikit[11]实现的高斯核支持向量机，自己实现的逻辑回归，以及[10]实现的神经网络。图6显示了MSE随神经网络时代的演变示例。C.分类预测表1和表2分别显示了测试数据的三个分类的准确率和召回率，表3和表4分别显示了训练数据的准确率和召回率。相应的测试ROC曲线（真阳性率与假阳性率）如图7、8和9所示。在我们的应用程序中，我们更强调召回而非精确性，因为我们不想失去任何现有的有利交易机会。在培训和测试中，三种分类的平均召回率都在60%左右。这指出了模型中存在的一个重要偏差。然而，在训练和测试中类似的精确度意味着这些模型可以很好地推广。在训练期间，我们还观察到神经网络参数（参见上图6）的高方差，我们引入了0.5的动量值。在每一次小批量梯度下降更新过程中，这会将系数的现有值缩小一半。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

可人4

2022-5-9 17:16:36

虽然准确度不是很高，但在金融应用中，比random高5-10%的准确度可以保证有利的交易。图6：神经网络算法的MSE与时代真实的SVM 60%61.69%逻辑回归58.73%62.37%神经网络57.77%59.66%表一：每个方向算法的测试召回率真实的SVM 62.58%58.59%逻辑回归62.5%59.09%神经网络60.46%56.95%表二：每个方向算法的实际测试准确率真实的SVM 61.84%58.72%逻辑回归60.51%59.45%神经网络65.17%54.26%表三：每种方向性算法的训练召回率真实的SVM 60.92%59.65%逻辑回归60.45%58.86%神经网络55.42%66.35%表四：每个方向的训练准确率d。交易策略利用分类师的预测，我们建立了一个日交易策略，在每天开始时，如果价格在5天后会下跌，我们就做多（买入）投资组合，否则就做空（卖出）。在出售投资组合之前，我们不需要太长时间，因为包括CME在内的大多数商品交易所都允许卖空。由于投资组合是这些工具的一种人工利差，对于做多，我们在ZF持有多头头寸，在ZN持有对冲调整的空头头寸，反之亦然。我们使用的交易规模是10单位ZF和8单位ZN，这是之前定义的P C2载荷的近似整数比。最后，在5天结束时，我们平仓并累积EFIG。7:SVMFig的ROC曲线。8：神经网络的ROC曲线在我们的PNL（利润和损失）中产生的美元刻度差。图10显示了该策略与通过从随机分类器获得预测进行交易的策略的定性比较。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

nandehutu2022

2022-5-9 17:16:41

请注意，该策略的提取非常低，不包括外汇交易成本和税费，在两年半的时间里，投资组合的交易规模为10个单位的可行性约为90000美元。V.结论和未来工作我们利用从投资组合组成部分的技术指标中通过深度信念网络学习到的特征，并利用这些特征生成投资组合每周变动方向的预测值，为衍生品投资组合构建一个日交易策略。我们观察到，特征重建算法收敛平稳。我们获得了510%以上的准确性比随机预测与三图。9：Logistic回归的ROC曲线图。10：投资组合PNL与我们使用的交易天数分类技术，以及更高的PNL。虽然一个简单化的策略可以产生一个中等积极的PNL，但复杂的算法交易涉及做出更复杂的决策，人们希望量化移动的幅度，为此建立一个基于回归的策略可能会有所帮助。为了学习投资组合价格变化的数量，递归神经网络非常有用。此外，最先进的信念网络非常适合连续输入，从RBM生成连续特征以解决适当的分类或回归问题是值得的。目前的交易方式似乎很有前途，将其用于多个交易所的衍生品交易的多个价差和黄油期货交易会很有趣。此外，如果一个人能够获得逐点数据，那么建立更高频率的交易策略也是值得的。参考文献[1]Yoshua Bengio。针对深层建筑基于梯度的培训的实用建议。《神经网络：交易技巧》，第437-478页。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

能者818

2022-5-9 17:16:45

斯普林格，2012年。[2] 杜米特鲁·二汉、约书亚·本吉奥、亚伦·库尔维尔、皮埃尔·安托万·曼扎戈、帕斯卡·文森特和萨米·本吉奥。为什么无监督培训有助于深度学习？《机器学习研究杂志》，2010年11:625-660。[3] 爱德华·盖特利。用于财务预测的神经网络。约翰·威利父子公司，1995年。[4] 杰弗里·辛顿。培训受限玻尔兹曼机器的实用指南。动量，9（1）：9262010。[5] 杰弗里·辛顿。通过最小化对比差异来培训专家的产品。神经计算，14（8）：1771-1800，2002年。[6] 杰弗里·辛顿、西蒙·奥辛德罗和叶维德。深度信念网的快速学习算法。神经计算，18（7）：1527-15542006。[7] 黄伟、中山义郎和王守洋。用支持向量机预测股票市场走势。计算机与运筹学，32（10）：2513–25222005。[8] 伊贝林·卡斯特拉和米尔顿·博伊德。设计用于预测金融和经济时间序列的神经网络。神经计算，10（3）：215–236，1996年。[9] 金敬在。使用支持向量机进行金融时间序列预测。神经计算，55（1）：307-3192003。[10] R.B.棕榈树。预测作为学习深层层次数据模型的候选者。硕士论文，2012年。[11] F.佩德雷戈萨、G.瓦罗夸克斯、A.格拉姆福特、V.米歇尔、B.蒂里安、O.格里塞尔、M.布隆德尔、P.普雷滕霍费尔、R.韦斯、V.杜堡、J.范德普拉斯、A.帕索斯、D.库尔纳佩、M.布鲁彻、M.佩罗和E.杜切斯内。Scikit learn：Python中的机器学习。机器学习研究杂志，12:2825–2830，2011。[12] 弗朗西斯·艾泰和曹丽娟。支持向量机在金融时间序列预测中的应用。Omega，29（4）：309-3172001。[13] 罗伯特R特里皮和埃弗拉姆头巾。金融和投资中的神经网络：利用人工智能改善现实世界的表现。麦格劳·希尔公司，1992年。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群