全部版块 我的主页
论坛 经济学人 二区 外文文献专区
1428 19
2022-04-26
英文标题:
《Machine Learning Advances for Time Series Forecasting》
---
作者:
Ricardo P. Masini, Marcelo C. Medeiros and Eduardo F. Mendes
---
最新提交年份:
2021
---
英文摘要:
  In this paper we survey the most recent advances in supervised machine learning and high-dimensional models for time series forecasting. We consider both linear and nonlinear alternatives. Among the linear methods we pay special attention to penalized regressions and ensemble of models. The nonlinear methods considered in the paper include shallow and deep neural networks, in their feed-forward and recurrent versions, and tree-based methods, such as random forests and boosted trees. We also consider ensemble and hybrid models by combining ingredients from different alternatives. Tests for superior predictive ability are briefly reviewed. Finally, we discuss application of machine learning in economics and finance and provide an illustration with high-frequency financial data.
---
中文摘要:
本文综述了有监督机器学习和高维时间序列预测模型的最新进展。我们同时考虑线性和非线性选择。在线性方法中,我们特别关注惩罚回归和模型集成。本文考虑的非线性方法包括前馈和递归的浅层和深层神经网络,以及基于树的方法,如随机森林和增强树。我们还通过组合来自不同替代品的成分来考虑整体模型和混合模型。简要回顾了优越预测能力的测试。最后,我们讨论了机器学习在经济和金融领域的应用,并以高频金融数据为例进行了说明。
---
分类信息:

一级分类:Economics        经济学
二级分类:Econometrics        计量经济学
分类描述:Econometric Theory, Micro-Econometrics, Macro-Econometrics, Empirical Content of Economic Relations discovered via New Methods, Methodological Aspects of the Application of Statistical Inference to Economic Data.
计量经济学理论,微观计量经济学,宏观计量经济学,通过新方法发现的经济关系的实证内容,统计推论应用于经济数据的方法论方面。
--
一级分类:Computer Science        计算机科学
二级分类:Machine Learning        机器学习
分类描述:Papers on all aspects of machine learning research (supervised, unsupervised, reinforcement learning, bandit problems, and so on) including also robustness, explanation, fairness, and methodology. cs.LG is also an appropriate primary category for applications of machine learning methods.
关于机器学习研究的所有方面的论文(有监督的,无监督的,强化学习,强盗问题,等等),包括健壮性,解释性,公平性和方法论。对于机器学习方法的应用,CS.LG也是一个合适的主要类别。
--
一级分类:Statistics        统计学
二级分类:Applications        应用程序
分类描述:Biology, Education, Epidemiology, Engineering, Environmental Sciences, Medical, Physical Sciences, Quality Control, Social Sciences
生物学,教育学,流行病学,工程学,环境科学,医学,物理科学,质量控制,社会科学
--
一级分类:Statistics        统计学
二级分类:Machine Learning        机器学习
分类描述:Covers machine learning papers (supervised, unsupervised, semi-supervised learning, graphical models, reinforcement learning, bandits, high dimensional inference, etc.) with a statistical or theoretical grounding
覆盖机器学习论文(监督,无监督,半监督学习,图形模型,强化学习,强盗,高维推理等)与统计或理论基础
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-4-26 16:17:21
时间序列预测的机器学习进展格里卡多·P·马西尼斯圣保罗经济学院,格图利奥·巴尔加斯基金会电子邮件:里卡多。masini@fgv.brMarceloC.里约热内罗天主教大学梅德罗斯经济系邮件:mcm@econ.puc-里约。brEduardo F.MendesSchool of Applied Mathematics,Getulio Vargas Foundation电子邮件:eduardo。mendes@fgv.brApril12,2021摘要本文综述了有监督机器学习和时间序列预测高维模型的最新进展。我们同时考虑线性和非线性替代。在线性方法中,我们特别关注惩罚回归和模型集成。本文考虑的非线性方法包括前馈和递归形式的浅层和深层神经网络,以及基于树的方法,如随机森林和增强树。我们还通过组合来自不同替代品的成分来考虑整体和混合模型。简要回顾了超预测能力测试。最后,我们讨论了机器学习在经济和金融领域的应用,并用高频金融数据进行了说明。JEL代码:C22关键字:机器学习、统计学习理论、惩罚回归、正则化、筛近似、非线性模型、神经网络、深度学习、回归树、随机森林、boosting、bagging、预测。致谢:我们非常感谢两位匿名裁判的深刻评论。第二作者感谢CNPq的部分财务支持。我们还感谢弗朗西斯·X·迪博尔德、丹尼尔·博鲁普、安达德里亚·巴比伊的有益评论。1简介本文综述了机器学习(ML)方法在经济和金融时间序列预测中的最新发展。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-26 16:17:27
ML方法已成为经济学和金融学应用研究人员的重要估计、模型选择和预测工具。在大数据时代,随着海量数据集的可用性,生成可靠、稳健的预测非常重要。然而,什么是机器学习?在过去的几年里,这无疑是一个流行词,它获得了很多流行。文献中有很多定义,其中一个最为成熟的定义来自艺术情报先驱Arthur L.Samuelwho,他将ML定义为“不需要明确编程就能让计算机学习的研究领域”我们更喜欢一个不那么模糊的定义,即ML是自动计算机算法与强大的统计方法的结合,以学习(发现)丰富数据集中的隐藏模式。从这个意义上说,统计学习理论为ML提供了统计学基础。因此,本文主要讨论统计学习的发展和notML,因为我们将重点讨论统计模型。ML方法可分为三大类:监督学习、非监督学习和强化学习。这项调查是监督学习,其中的任务是学习一个函数,该函数基于作为输入输出对组织的数据,将输入(解释变量)映射到输出(因变量)。例如,回归模型就属于这一类。另一方面,无监督学习是一类ML方法,它可以发现数据集中不存在标签的未检测模式,例如聚类分析或数据压缩算法。最后,在强化学习中,代理学习在环境中执行某些操作,从而获得最大回报。它通过探索和利用所学的知识,通过反复尝试最大化回报来实现这一目标。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-26 16:17:34
这是几个艺术智能游戏玩家(比如阿尔法戈)以及连续治疗(比如强盗问题)的核心。本文介绍的监督最大似然法大致可分为两组。Firstone包括线性模型,将在第2节中讨论。我们主要关注通过正则化(也称为收缩)估计的规格。这种方法至少可以追溯到托蒂霍诺夫(1943年)。在统计学和计量经济学中,在威拉德·詹姆斯和查尔斯·斯坦(Willard James和Charles Stein)发表开创性论文,推广了统计估计中的偏差-方差权衡(Stein,1956;James和Stein,1961)之后,正则化估计器受到了关注。我们首先考虑Hoerl和Kennard(1970)提出的边缘回归估计。然后,我们给出了Tibshirani(1996)的最小绝对收缩和选择(LASSO)估计及其许多推广。我们还讨论了其他处罚。还回顾了相关数据的理论推导和影响。第二组ML技术关注非线性模型。我们在第3节中讨论了这个主题,首先介绍了一个基于筛半参数近似的统一框架。最近,因果推理的ML开始受到很多关注。然而,这项调查将不包括ML方法的因果推断。最初的一句话是“为计算机编程以从经验中学习,最终将消除对这种详细编程工作的需求。”见塞缪尔(1959)。正如格伦纳德(1981)所说。我们继续分析特定模型,作为我们总体设置的特例。更具体地说,我们涵盖了前馈神经网络,包括其浅层和深层版本和递归神经网络,以及基于树的模型,如随机森林和增强树。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-26 16:17:41
神经网络(NN)可能是最流行的ML方法之一。在我们看来,成功的部分原因是对人脑功能的错误类比。与早期文献中所吹嘘的相反,NN模型的经验成功来自一个数学事实,即大量简单基函数的线性组合能够在特定的度量选择中很好地逼近非常复杂的函数。回归树只有在发展了算法来减弱估计模型的不稳定性之后才流行起来。像随机森林和增强树这样的算法现在都在应用经济学家的工具箱里。除上述模型外,我们还对基于集合的方法进行了调查,如Bagging-Breiman(1996)和完整子集回归(Elliott等人,2013、2015)。此外,我们还简要介绍了我们称之为“混合方法”的方法,将线性和非线性模型的思想结合起来,生成新的ML预测方法。在对这些方法进行实证说明之前,我们将讨论在ML方法的背景下对超预测能力的测试。1.1一般框架快速记法:大写字母X表示随机量,小写字母X表示确定性(非随机)量。inX和x等粗体字母是为向量和矩阵等多变量对象保留的。q的符号k·KQ≥ 1表示向量的`qnorm。对于集合S,我们用| S |表示其基数。给定一个随机向量(Yt,Zt)的T个实现的样本,目标是预测h=1,H.在本文中,我们考虑以下假设:假设1(DGP)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-26 16:17:47
让{(Yt,Zt)}∞t=1是一个协方差平稳随机过程,取值于Rd+1。因此,我们排除了通常出现在时间序列应用程序中的重要非平稳过程。特别地,假设1排除了长记忆过程中的单位根和某些类型。对于(通常预先确定的)整数p≥ 1和r≥ 0定义预测因子Xt的n维向量:=Yt-1.Yt-p、 Zt,Zt-R其中n=p+d(r+1),考虑以下直接预测模型:Yt+h=fh(Xt)+Ut+h,h=1,H、 t=1,T、 (1.1)其中fh:Rn→ R是未知(可测量)函数,Ut+h:=Yt+h-fh(Xt)被假定为零均值和有限方差。通过在模型中包含截距,始终可以确保零均值条件。此外,方差模型fh可以是条件期望函数fh(x)=E(Yt+h | Xt=x),或者暗示Yt+Hon到Xt跨越的空间的最佳线性投影。无论选择哪种型号,我们的目标都是fh,因为h=1,H.由于FH未知,应根据数据进行估算。目标函数可以是单个模型,也可以是不同规格的集合,而且对于每个预测期,目标函数也可能发生重大变化。给定fh的估计值,下一步是通过估计其预测精度来评估预测方法。大多数预测准确度的衡量标准都来自随机量h(Xt):=| bfh(Xt)-fh(Xt)|。例如,术语预测一致性指的是h(Xt)p-→ 0作为T→ ∞ 概率被认为是无条件的;A对应于其条件对应项,由h(xt)p-→ 0,其中概率定律以Xt=Xt为条件。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群