全部版块 我的主页
论坛 经济学人 二区 外文文献专区
1144 21
2022-05-11
英文标题:
《Extracting Predictive Information from Heterogeneous Data Streams using
  Gaussian Processes》
---
作者:
Sid Ghoshal, Stephen Roberts
---
最新提交年份:
2018
---
英文摘要:
  Financial markets are notoriously complex environments, presenting vast amounts of noisy, yet potentially informative data. We consider the problem of forecasting financial time series from a wide range of information sources using online Gaussian Processes with Automatic Relevance Determination (ARD) kernels. We measure the performance gain, quantified in terms of Normalised Root Mean Square Error (NRMSE), Median Absolute Deviation (MAD) and Pearson correlation, from fusing each of four separate data domains: time series technicals, sentiment analysis, options market data and broker recommendations. We show evidence that ARD kernels produce meaningful feature rankings that help retain salient inputs and reduce input dimensionality, providing a framework for sifting through financial complexity. We measure the performance gain from fusing each domain\'s heterogeneous data streams into a single probabilistic model. In particular our findings highlight the critical value of options data in mapping out the curvature of price space and inspire an intuitive, novel direction for research in financial prediction.
---
中文摘要:
金融市场是出了名的复杂环境,呈现出大量嘈杂但潜在信息丰富的数据。我们考虑使用带有自动相关确定(ARD)核的在线高斯过程从广泛的信息源预测金融时间序列的问题。我们通过融合四个独立的数据域(时间序列技术、情绪分析、期权市场数据和经纪人建议)中的每一个来衡量绩效收益,并以标准化均方根误差(NRMSE)、中值绝对偏差(MAD)和皮尔逊相关性进行量化。我们证明,ARD内核产生有意义的特征排名,有助于保留显著的输入并降低输入维度,为筛选财务复杂性提供了一个框架。我们测量将每个域的异构数据流融合到单个概率模型中的性能增益。特别是,我们的研究结果强调了期权数据在绘制价格空间曲率方面的关键价值,并为金融预测的研究提供了直观、新颖的方向。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--
一级分类:Statistics        统计学
二级分类:Machine Learning        机器学习
分类描述:Covers machine learning papers (supervised, unsupervised, semi-supervised learning, graphical models, reinforcement learning, bandits, high dimensional inference, etc.) with a statistical or theoretical grounding
覆盖机器学习论文(监督,无监督,半监督学习,图形模型,强化学习,强盗,高维推理等)与统计或理论基础
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-5-11 02:00:39
Algorithmic Finance 5(2016)21–30DOI:10.3233/AF-160055IOS Press使用高斯过程从异构数据流中提取预测信息。戈沙拉,b,*和S.Robertsa,b,英国牛津大学工程科学系,英国牛津大学UKbOxford Man定量金融研究所。金融市场是出了名的复杂环境,呈现出大量嘈杂但潜在信息丰富的数据。我们考虑使用具有自动相关确定(ARD)核的在线高斯过程从广泛的信息源预测金融时间序列的问题。我们通过融合四个独立的数据域(时间序列技术、情绪分析、期权市场数据和经纪人建议)中的每一个,以标准化均方根误差(NRMSE)、中值绝对偏差(MAD)和皮尔逊相关性来衡量绩效增益。我们证明,ARD内核产生了有意义的特征排名,有助于保留有效的输入并降低输入维度,为筛选财务复杂性提供了一个框架。我们测量将每个域的异构数据流融合到单个概率模型中的性能增益。特别是,这些发现突出了期权数据在绘制价格空间曲线方面的关键价值,并为金融预测研究提供了直观、新颖的方向。关键词:时间序列分析、财务预测、贝叶斯方法、高斯过程1。引言财务预测的核心挑战之一是确定在哪里寻找。金融机构的时间序列历史、可比数据和衍生品、新闻文章和观点文章都有可能影响价格演变。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-11 02:00:43
对于金融界和机器学习界来说,开发一个强大的框架,用于从不同的、联合信息丰富的数据集中提取知识,仍然是一个公开的挑战。在本文中,我们预测了S&P500指数的日收益率,这是一个广泛的市场基准,用于衡量通常被视为金融稳定性的指标。标准普尔500指数是一封市值电子邮件:sjrob@robots.ox.ac.uk.*通讯作者:S.戈沙尔。电话:+447740700665;电子邮件:sghoshal@robots.ox.ac.uk.weighted美国500家最大公司的指数,涵盖了技术、消费品、公用事业和金融服务公司的所有领域。这是世界上最明显的基准之一,买入并持有共同基金和高频对冲基金都在积极交易。我们首先假设四大类,从中寻找显著的解释变量。市场技术指标包括测量自相关的滞后回报,以及行业中使用的图表信号,如移动平均收敛发散(MACD)。情绪分析涵盖了新闻流的影响,通过社交媒体中的乐观主义或悲观主义来衡量。期权市场度量让我们得以一瞥市场专家的定位,并为我们提供了一种原则性的、数据驱动的方法,将价格空间建模为一个具有方向偏差和回报压缩区域的非均匀维度。经纪人建议整理2158-5571/16/$35.00(c)2016–IOS出版社和作者。保留所有权利22 S.Ghoshal和S。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-11 02:00:46
Roberts/利用高斯过程从异构数据流中提取预测信息是股票分析师的智慧,使我们能够测量他们的升级和降级的预测值(如果有的话)。我们证明,当组合来自每个域的信号时,预测性能会提高,并通过在自适应高斯过程模型的协方差参数化中实现自动相关确定(ARD),为输入的分类提供了一个原则框架。从这一分析中得出的排名定义了预期,并鼓励进一步调查期权市场和价格空间代表性。2.前期工作我们首先通过使用各种数据流回顾财务预测领域的相关前期研究,为我们的研究建立背景。然后我们将注意力转向常用的多元分析技术。技术分析是最早的金融预测形式之一,17世纪首次出现在荷兰市场的商品统计中。在20世纪40年代正式成为一门学科(Edwards and Magee,1946),它涉及使用价格和数量时间序列进行定向预测。之前的回归分析(Lo等人,2000年)对其进行了广泛研究,证明了通过识别价格历史中的特定模式所提供的增量增益预测性能。技术驱动的高斯过程回归已被应用于预测各种资产类别的时间序列,包括股票市场价格(Farrell和Correa,2007年)、股票市场波动性(Ou和Wang,2009年)和商品价差(Chapados和Bengio,2007年)。这些研究表明,模型性能高度依赖于训练集的大小。近几十年来,利用文本数据进行财务预测的文献激增,密切跟踪自然语言处理领域的进展。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-11 02:00:50
这一领域的方法通常涉及将单词或短语转换为情绪的数值量具,用以预测股市方向(Nikfarjam等人,2010)。建模技术包括简单的朴素贝叶斯或支持向量机分类器,以及基于深度学习的更高级算法。最近,情绪构成方面的更多研究试图利用新闻流量数据预测美国非农就业人数等经济指标。这些研究表明,对新闻文章的准确解析可以为市场动态公告提供最先进的预测(Levenberg等人,2013年、2014年)。关于股票和期权市场价格之间相互作用的研究很少,尽管早期曾尝试评估成交量数据中的相关性。研究表明,看涨期权流动导致标的股票流动滞后一天,这证明了期权和股票市场之间信息流动顺序的假设(Anthony,1998)。已经进行了多项研究,以确定买卖建议对股票价格的影响。对股票分析师报告的研究显示,在经纪人行为的数学计算之后,出现了显著的、系统的但不对称的漂移,在升级后短暂、适度的收益,但在降级后持续的材料抛售(Womack,1996)。这些变化的程度不仅取决于行动(升级与降级),还取决于分析师的声誉、他们经纪公司的规模以及推荐公司的规模(Stickel,1995)。各种技术已应用于金融领域的多元分析,依靠独立成分分析降低维度(Luet al.,2009)和椭圆copula模型捕捉输入依赖性(Biller和Corlu,2012)。这些研究发现,使用同一领域的多个时间序列可以获得增量信息。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-11 02:00:55
相比之下,我们的工作侧重于异构数据融合和域间依赖关系建模。3.数据在本节中,我们详细介绍了所考虑的四个领域中每个领域的特征,所有这些特征都将用于预测收益率(t+1),以及标准普尔500指数上的下一天日志收益率。3.1. 技术指标市场技术指标是直接从金融工具的价格历史p(t)中得出的指标。我们考虑工业界常见的四个特征(Taylor和Allen,1992):标准普尔500指数的前一个日对数收益率、其50天的简单移动平均值,以及移动平均收敛散度(MACD)和信号线,由时间序列的指数移动平均值(EMA)构成,如下所示:MACD(t)=12天EMAp(t)- 26天均线p(t)(1) S.Ghoshal和S.Roberts/使用高斯过程从异构数据流中提取预测信息23信号线(t)=MACD(t)- 9日均线MACD(t)(2) 我们不认为这些指标的制定本身就有意义,而是认为标准化定义提供了图表市场参与者反应的精确、可测量的阈值。包括这些功能将使我们的模型能够识别这些阈值,从而预测技术引导的订单流量。3.2. 情绪分析虽然事实新闻流很重要,但市场对其解读的极性——节拍或失望——推动了市场运动。市场情绪是通过Twitter和Stocktwits中的指标捕捉到的,这是一个致力于金融市场实时讨论的社交媒体网站,标准普尔500指数散户投资者经常光顾。通过跟踪情绪指数的每日变化,得出了另外两个指标。3.3.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群