全部版块 我的主页
论坛 经济学人 二区 外文文献专区
1040 11
2022-06-24
英文标题:
《Mid-price Prediction Based on Machine Learning Methods with Technical
  and Quantitative Indicators》
---
作者:
Adamantios Ntakaris, Juho Kanniainen, Moncef Gabbouj, Alexandros
  Iosifidis
---
最新提交年份:
2019
---
英文摘要:
  Stock price prediction is a challenging task, but machine learning methods have recently been used successfully for this purpose. In this paper, we extract over 270 hand-crafted features (factors) inspired by technical and quantitative analysis and tested their validity on short-term mid-price movement prediction. We focus on a wrapper feature selection method using entropy, least-mean squares, and linear discriminant analysis. We also build a new quantitative feature based on adaptive logistic regression for online learning, which is constantly selected first among the majority of the proposed feature selection methods. This study examines the best combination of features using high frequency limit order book data from Nasdaq Nordic. Our results suggest that sorting methods and classifiers can be used in such a way that one can reach the best performance with a combination of only very few advanced hand-crafted features.
---
中文摘要:
股票价格预测是一项具有挑战性的任务,但机器学习方法最近已成功用于此目的。在本文中,我们从技术和定量分析中提取了270多个手工特征(因素),并在短期中期价格变动预测中检验了它们的有效性。我们重点讨论了一种使用熵、最小均方和线性判别分析的包装特征选择方法。我们还为在线学习构建了一个新的基于自适应logistic回归的定量特征,该特征在大多数提出的特征选择方法中始终处于第一位。本研究使用纳斯达克北欧证券交易所的高频限价指令簿数据来检验特征的最佳组合。我们的结果表明,排序方法和分类器的使用方式可以使您只需结合极少数高级手工功能即可达到最佳性能。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--
一级分类:Computer Science        计算机科学
二级分类:Machine Learning        机器学习
分类描述:Papers on all aspects of machine learning research (supervised, unsupervised, reinforcement learning, bandit problems, and so on) including also robustness, explanation, fairness, and methodology. cs.LG is also an appropriate primary category for applications of machine learning methods.
关于机器学习研究的所有方面的论文(有监督的,无监督的,强化学习,强盗问题,等等),包括健壮性,解释性,公平性和方法论。对于机器学习方法的应用,CS.LG也是一个合适的主要类别。
--
一级分类:Statistics        统计学
二级分类:Machine Learning        机器学习
分类描述:Covers machine learning papers (supervised, unsupervised, semi-supervised learning, graphical models, reinforcement learning, bandits, high dimensional inference, etc.) with a statistical or theoretical grounding
覆盖机器学习论文(监督,无监督,半监督学习,图形模型,强化学习,强盗,高维推理等)与统计或理论基础
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-6-24 10:26:08
基于具有技术和定量指标的机器学习方法的中期价格预测Damantios Ntakarisa,*, Juho Kanniainna、Moncef Gabbouja、Alexandros Iosi fidisbafaculty of Information Technology and Communication Sciences,Tampere University,FI-33720,Tampere,Finlandb工程、电气和计算机工程系,奥胡斯大学,8000,Aarhus,DenmarkAbstracts股票价格预测是一项具有挑战性的任务,但是机器学习方法最近已经成功地用于这一目的。在本文中,我们从技术和定量分析中提取了270多个手工特征(因素),并在短期中期价格走势预测中检验了它们的有效性。我们重点讨论了一种使用熵、最小均方和线性描述分析的包装特征选择方法。我们还为在线学习构建了一个新的基于自适应logistic回归的定量特征,该特征在大多数提出的特征选择方法中一直处于首选。这项研究使用纳斯达克北欧证券交易所(Nasdaq Nordic)的高频限价订单账簿数据来检验特征的最佳组合。我们的结果表明,排序方法和分类器可以在这样的地方使用,只需结合极少数高级手工特征即可达到最佳性能。关键词:高频交易、中间价、机器学习、技术分析、定量分析1。引言本文考虑的问题是在高频金融交易期间预测股票的中间价格变动。在给定的时间实例中,股票的中间价定义为最佳买卖价格的平均值。我们认为中间价对于持续平衡库存的做市商以及需要能够预测市场走势以盈利的交易员来说是至关重要的信息。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 10:26:11
此外,中间价有助于监控市场的稳定性(即欺骗识别)。在过去几年中,已经提出了几种分析股市数据的方法,如[18]、[33]、[68]、[81]、[87]、[89]和[90]中所述的方法。所有这些方法都遵循由两个处理步骤组成的标准分类管道。给定交易过程中的一个时间实例,根据当前实例之前的一个(通常很短)时间窗口来描述市场状态。选择一组手工制作的功能来描述市场动态,从而形成avector表示。基于这种表示,然后使用分类器预测预测范围内某个时间点的市场状态,如图1所示。我们在第2节中看到的大多数研究使用了非常有限的功能,但没有提供选择这些功能的动机,而在这里我们涵盖了大多数:i)技术指标,ii)最先进的限额订单(LOB)功能,以及iii)定量指标。也利用这些特征集的工作可以在[65]中找到。此外,我们还提出了一种新的advancequantitative特征,该特征是在几种特征选择机制中首先选择的,用于中等价格变动预测任务。使用不同的手工制作功能会导致对金融时间序列的不同属性进行编码,排除其中一些功能可能会导致无法利用*相应的authorEmail地址:adamantios。ntakaris@tuni.fi(Adamantios Ntakaris)图1:中间价格预测的概念可以描述如下:在给定的时间实例t,股票的状态被编码为基于向量的表示,该表示使用来自长度为t的短期时间窗口的多维时间序列信息计算得出。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 10:26:14
鉴于此表示,预计中间价的方向为t、 相关信息。一组好的特征的定义与后续分析的性能直接相关,因为在这一阶段丢弃的任何信息稍后都无法由分类器恢复。用于解决此问题的最广泛采用的方法之一是使用特征选择方法(例如,[15]、[57]),该方法可以使用各种类型的特征排序标准以包装方式执行。虽然使用基于变换的降维技术(如主成分分析或线性判别分析)可以产生类似的处理管道,但在本文中,我们感兴趣的是确定传递数据中大部分信息的特征集。[5]和[52]中使用了使用无监督标准的特征选择,尤其是最大熵标准。这种方法背后的动机是,随着特征的熵增加(当在一组数据中计算时),数据方差以及它编码的信息也会增加。然而,在基于avector的表示中,许多高熵特征的组合并不一定会带来良好的分类性能。这是因为所采用的数据表示的不同维度需要编码不同的信息。在本文中,我们对各种手工制作的特征(总共273个)进行了广泛的分析,形成了价格变动预测。我们的分析基于一种基于包装的特征选择方法(即[48]),该方法利用无监督和有监督的特征排序标准。更具体地说,我们使用最大熵(即[5]、[52])、基于线性判别分析(LDA)[84]的最大类判别以及基于回归的分类[16]。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 10:26:18
功能选择方法的这些不同实现被应用于大量手工制作的功能。我们研究中使用的手工特征列表涵盖了两种不同交易方法的基本和高级特征,即侧重于技术和定量分析的交易方法。技术分析基于这样一个事实,即价格预测可以通过监控价格和成交量图来实现,而定量分析则侧重于统计模型和参数估计。对于技术指标,我们通过数字滤波器计算基本和高级功能,而对于定量指标,我们主要关注时间序列分析和在线机器学习。我们提供完整的特征列表和描述,并将其作为十二个特征选择模型(每个模型对应不同的标准和分类组合)的输入,用于我们的分类任务。我们不仅给出了这两类特征的最佳子集组合,而且还就F1性能对特征库的两种交易方式进行了清晰的比较(即F1得分是衡量性能的最重要指标,并计算为精确度和召回率的调和平均值)。据我们所知,这是第一次研究确定哪些类型的信息需要用于高频时间序列描述和分类。我们工作的主要贡献在于三大支柱。第一支柱是指在高频tradinguniverse中首次利用文献中的大部分技术指标。第二个支柱是开发新的量化特征,称为自适应logisticregression特征,该特征在多个特征选择指标中排名第一。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 10:26:21
最后,第三个支柱是通过将熵、LDA和LMS转换为特征选择标准,对这三个特征集(即技术、定量和LOBindicators)进行公平和程度的评估。该评估利用LMS、LDA和径向基函数网络(RBFN)作为中等价格移动预测任务的分类器。我们的发现表明,只有利用从定量和技术手工制作的功能集中获得的极少数高级功能,才能达到最佳性能。论文的其余部分组织如下。我们在第2节中提供了全面的文献综述。第3节提供了问题陈述和数据描述。第4节列出了手工制作的功能。在第5节中,我们描述了我们分析中采用的包装器方法的各种实现,而第6节提供了实证结果,第7节总结了本文。附录部分提供了我们实验中使用的所有特性的详细描述,以及每个方法的所有排名列表。2、相关知识算法交易(algorithmic trading)的兴起表明信号和统计分析。算法交易是一种需要根据特定规则使用计算机的交易,可以快速执行精确计算。有几种工具基于这两种类型的分析,机器学习(ML)交易者可以利用这两种分析来选择最佳交易。但是,哪些指标(即。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群