全部版块 我的主页
论坛 经济学人 二区 外文文献专区
1022 13
2022-06-14
英文标题:
《Feature Engineering for Mid-Price Prediction with Deep Learning》
---
作者:
Adamantios Ntakaris, Giorgio Mirone, Juho Kanniainen, Moncef Gabbouj,
  Alexandros Iosifidis
---
最新提交年份:
2019
---
英文摘要:
  Mid-price movement prediction based on limit order book (LOB) data is a challenging task due to the complexity and dynamics of the LOB. So far, there have been very limited attempts for extracting relevant features based on LOB data. In this paper, we address this problem by designing a new set of handcrafted features and performing an extensive experimental evaluation on both liquid and illiquid stocks. More specifically, we implement a new set of econometrical features that capture statistical properties of the underlying securities for the task of mid-price prediction. Moreover, we develop a new experimental protocol for online learning that treats the task as a multi-objective optimization problem and predicts i) the direction of the next price movement and ii) the number of order book events that occur until the change takes place. In order to predict the mid-price movement, the features are fed into nine different deep learning models based on multi-layer perceptrons (MLP), convolutional neural networks (CNN) and long short-term memory (LSTM) neural networks. The performance of the proposed method is then evaluated on liquid and illiquid stocks, which are based on TotalView-ITCH US and Nordic stocks, respectively. For some stocks, results suggest that the correct choice of a feature set and a model can lead to the successful prediction of how long it takes to have a stock price movement.
---
中文摘要:
由于LOB的复杂性和动态性,基于LOB数据的中间价变动预测是一项具有挑战性的任务。到目前为止,基于LOB数据提取相关特征的尝试非常有限。在本文中,我们通过设计一组新的手工特征并对流动和非流动股票进行广泛的实验评估来解决这个问题。更具体地说,我们实现了一组新的计量经济学特征,这些特征捕获了基础证券的统计特性,用于中期价格预测任务。此外,我们还开发了一个新的在线学习实验协议,该协议将任务视为一个多目标优化问题,并预测i)下一次价格变动的方向,以及ii)在发生变化之前发生的订单事件的数量。为了预测中期价格变动,将这些特征输入到九种不同的深度学习模型中,这些模型基于多层感知器(MLP)、卷积神经网络(CNN)和长-短期记忆(LSTM)神经网络。然后,分别以TotalView ITCH美国和北欧股票为基础,对流动性股票和非流动性股票的绩效进行评估。对于一些股票,结果表明,正确选择特征集和模型可以成功预测股价波动所需的时间。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--
一级分类:Computer Science        计算机科学
二级分类:Machine Learning        机器学习
分类描述:Papers on all aspects of machine learning research (supervised, unsupervised, reinforcement learning, bandit problems, and so on) including also robustness, explanation, fairness, and methodology. cs.LG is also an appropriate primary category for applications of machine learning methods.
关于机器学习研究的所有方面的论文(有监督的,无监督的,强化学习,强盗问题,等等),包括健壮性,解释性,公平性和方法论。对于机器学习方法的应用,CS.LG也是一个合适的主要类别。
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-6-14 11:29:19
深度学习Adamantios Ntakarisa的中等价格预测功能工程,*, 乔治·米罗内布,*, Juho Kanniainna、Moncef Gabbouja、Alexandros Iosi信息技术和通信科学研究所、坦佩雷大学、Korkeakoulunkatu 1、FI-33720、坦佩雷、芬兰巴丹马克国家银行、Havengade 5 1093 Kobenhavn K、哥本哈根、丹麦奥胡斯大学工程、电气和计算机工程系、芬兰斯加德22、Hangovej 2、,由于限价订单的复杂性和动态性,基于限价订单数据的DenmarkAbstractMid价格变动预测是一项具有挑战性的任务。到目前为止,基于限额订单簿数据提取相关特征的尝试非常有限。在本文中,我们通过设计一组新的手工特征并对流动和非流动股票进行广泛的实验评估来解决这个问题。更具体地说,我们提供了一组广泛的计量经济学特征,这些特征捕获了基础证券的统计特性,用于中期价格预测任务。实验评估包括与文献中的其他手工特征以及通过完全自动化过程从长-短期记忆自动编码器中提取的特征进行正面比较。此外,我们还开发了一种新的在线学习实验协议,将上述任务视为一个多目标优化问题,并预测i)下一次价格变动的方向,以及ii)在发生变化之前发生的订单事件的数量。为了预测中期价格变动,将特征输入到九种不同的深度学习模型中,这些模型基于多层感知器、卷积神经网络和长-短期记忆神经网络。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 11:29:22
然后在流动和非流动股票(即TotalView ITCH Us和Nordic股票)上评估拟议方法的性能。对于一些股票,结果表明,正确选择特征集和模型可以成功预测股价波动所需的时间。关键词:深度学习、计量经济学、高频交易、限价指令簿、中间价、美国数据1。金融市场的自动化增加了信息分析的复杂性。这种复杂性可以通过使用限额指令簿(LOB)等有序交易世界来有效管理。LOB是根据订单类型(即买卖双方)在价格水平上转换每日未执行交易活动的一种形式。日常交易活动是一个大数据问题,因为在一个交易日内会发生数百万个交易事件。每个交易环节的信息提取和数字信号(即时间序列)分析为机器学习(ML)交易者提供了关于订单、执行和取消交易的有用指示。传统的时间序列分析方法无法充分反映当代交易市场的复杂性。例如,[45]和[47]中的研究表明,与RIMA和GARCH模型相比,用于财务指标预测的经典机器学习和深度学习方法可以获得更好的结果。相反,机器和深度学习方法已被证明是时间序列分析和预测的非常有效的机制(例如,[14]、[39]、[49])。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 11:29:27
主要*相应的作者电子邮件地址:adamantios。ntakaris@tuni.fi(Adamantios Ntakaris),gmirone@econ.au.dk(Giorgio Mirone)免责声明:本文中表达的观点和结论仅为作者的观点和结论,不一定反映丹麦国家银行的观点。这些方法的优点是能够捕捉输入数据的非线性,并通过创建与建议问题更相关的新加权特征来连续过滤。尽管机器和深度学习方法在预测时间序列方面很有效,但它们主要是通过实证测试开发出来的。专注于DEP学习框架的大多数文献(例如,[55]、[19]、[25])仅依赖于原始数据或有限数量的特征。到目前为止,对于神经网络应该为中期价格预测任务分析的信息,人们关注得很少。在本文中,我们阐明了ML交易者在中期价格变动预测中应考虑利用的信息。为此,我们采用了大量的计量经济学特征进行中期价格预测,并与以下指标进行了正面比较:i)技术和定量分析(即[40]),ii)时间敏感和时间不敏感特征(即[31]和[41]),以及iii)通过全自动过程提取的特征。这一全自动特征提取过程由长短时记忆(LSTM)自动编码器(AE)执行。我们选择计量经济学作为我们手工制作特征的动机,因为它是金融工程领域,能够捕捉微观结构噪音和数据因果关系的经验证据。我们的数据伴随着价格的变化,在金融文献中被称为波动率,这是一种衡量我们手工制作的特性的指标。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 11:29:29
尽管学术文献普遍认为波动性本身不是影响股票回报的因素,但有充分的证据支持相反的观点。例如,在[26]中,作者发现波动性与数据中无法直接观察到的其他指标(如流动性溢价)一起影响股票回报。同样,Lettau和Ludvigson[34]提供的证据表明,消费与财富的比率会影响股票市场超额回报的信息,波动性解释了这些回报的重要部分。另一个例子是Chung和Chuwonganant的工作【17】,作者在这项工作中找到了强有力的证据,证明市场波动会影响个别股票的回报。在这种情况下,我们认为这些是将计量经济学视为中等价格变动预测任务的特征的可靠指标。我们根据最近提出的用于财务时间序列分析的深度学习模型进行分析。这些模型从多层感知器(MLP)到卷积神经网络(CNN)和类似LSTM的递归神经网络(RNN)。在我们的实验中,我们使用了来自美国和北欧股市的两个TotalView瘙痒数据集。我们根据两个协议制定了这些实验:第一个协议(即我们实验中的“协议i”)是首次在这里介绍的,并且基于在线学习。中间价变动的预测每发生一次,并被视为一个多目标优化问题,因为它可以预测中间价变动的时间和方向。第二个协议(即我们实验中的“协议II”)是基于Tsantekidis等人工作的现有协议。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 11:29:32
【54】,根据这一点,每10天的中期价格变动预测被视为三类分类问题(即上升、下降或静态中期价格状态)。我们工作的主要贡献在于三大支柱。第一个支柱是利用广泛的计量经济学特征列表作为深入学习模型的输入,用于中等价格变动预测。第二个支柱是通过另外两个手工制作的功能集和一个基于全自动流程的功能集对新引入的功能进行广泛评估。我们对这些特征集进行afair评估,使用相同的九个流动性和非流动性股票的深度学习模型,以及不平衡和平衡的特征集。接下来,我们不仅对新引入的实验方案进行测试,还对北欧数据集(此处也使用)文献中建议的方案进行测试。我们的发现表明,手工制作的特征,其性能超过了完全自动化的特征提取过程(即基于LSTM AE),改变了高频交易的预测范围。更具体地说,目前的评估有助于交易员根据数据、库存和模型可用性选择合适的功能。最后,第三个支柱是指开发一种新的实验协议,该协议考虑到每个交易事件,并且不受高频数据中时间不规则性的影响。我们的工作建议根据库存和型号选择定制特征提取;类似的发现见【23】。计量经济学特征过去用于识别汇率波动的重大变化(即[56])或[62]中的破产预测等任务。目前的研究为其他一些应用开辟了道路。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群