时间序列预测的机器学习进展

1585

收藏 2022-04-26

英文标题：
《Machine Learning Advances for Time Series Forecasting》
---
作者：
Ricardo P. Masini, Marcelo C. Medeiros and Eduardo F. Mendes
---
最新提交年份：
2021
---
英文摘要：
In this paper we survey the most recent advances in supervised machine learning and high-dimensional models for time series forecasting. We consider both linear and nonlinear alternatives. Among the linear methods we pay special attention to penalized regressions and ensemble of models. The nonlinear methods considered in the paper include shallow and deep neural networks, in their feed-forward and recurrent versions, and tree-based methods, such as random forests and boosted trees. We also consider ensemble and hybrid models by combining ingredients from different alternatives. Tests for superior predictive ability are briefly reviewed. Finally, we discuss application of machine learning in economics and finance and provide an illustration with high-frequency financial data.
---
中文摘要：
本文综述了有监督机器学习和高维时间序列预测模型的最新进展。我们同时考虑线性和非线性选择。在线性方法中，我们特别关注惩罚回归和模型集成。本文考虑的非线性方法包括前馈和递归的浅层和深层神经网络，以及基于树的方法，如随机森林和增强树。我们还通过组合来自不同替代品的成分来考虑整体模型和混合模型。简要回顾了优越预测能力的测试。最后，我们讨论了机器学习在经济和金融领域的应用，并以高频金融数据为例进行了说明。
---
分类信息：

一级分类：Economics 经济学
二级分类：Econometrics 计量经济学
分类描述：Econometric Theory, Micro-Econometrics, Macro-Econometrics, Empirical Content of Economic Relations discovered via New Methods, Methodological Aspects of the Application of Statistical Inference to Economic Data.
计量经济学理论，微观计量经济学，宏观计量经济学，通过新方法发现的经济关系的实证内容，统计推论应用于经济数据的方法论方面。
--
一级分类：Computer Science 计算机科学
二级分类：Machine Learning 机器学习
分类描述：Papers on all aspects of machine learning research (supervised, unsupervised, reinforcement learning, bandit problems, and so on) including also robustness, explanation, fairness, and methodology. cs.LG is also an appropriate primary category for applications of machine learning methods.
关于机器学习研究的所有方面的论文（有监督的，无监督的，强化学习，强盗问题，等等），包括健壮性，解释性，公平性和方法论。对于机器学习方法的应用，CS.LG也是一个合适的主要类别。
--
一级分类：Statistics 统计学
二级分类：Applications 应用程序
分类描述：Biology, Education, Epidemiology, Engineering, Environmental Sciences, Medical, Physical Sciences, Quality Control, Social Sciences
生物学，教育学，流行病学，工程学，环境科学，医学，物理科学，质量控制，社会科学
--
一级分类：Statistics 统计学
二级分类：Machine Learning 机器学习
分类描述：Covers machine learning papers (supervised, unsupervised, semi-supervised learning, graphical models, reinforcement learning, bandits, high dimensional inference, etc.) with a statistical or theoretical grounding
覆盖机器学习论文（监督，无监督，半监督学习，图形模型，强化学习，强盗，高维推理等）与统计或理论基础
--

---
PDF下载：
-->

Machine_Learning_Advances_for_Time_Series_Forecasting.pdf
大小:(2.74 MB)

马上下载

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

kedemingshi

2022-4-26 16:17:21

时间序列预测的机器学习进展格里卡多·P·马西尼斯圣保罗经济学院，格图利奥·巴尔加斯基金会电子邮件：里卡多。masini@fgv.brMarceloC.里约热内罗天主教大学梅德罗斯经济系邮件：mcm@econ.puc-里约。brEduardo F.MendesSchool of Applied Mathematics，Getulio Vargas Foundation电子邮件：eduardo。mendes@fgv.brApril12，2021摘要本文综述了有监督机器学习和时间序列预测高维模型的最新进展。我们同时考虑线性和非线性替代。在线性方法中，我们特别关注惩罚回归和模型集成。本文考虑的非线性方法包括前馈和递归形式的浅层和深层神经网络，以及基于树的方法，如随机森林和增强树。我们还通过组合来自不同替代品的成分来考虑整体和混合模型。简要回顾了超预测能力测试。最后，我们讨论了机器学习在经济和金融领域的应用，并用高频金融数据进行了说明。JEL代码：C22关键字：机器学习、统计学习理论、惩罚回归、正则化、筛近似、非线性模型、神经网络、深度学习、回归树、随机森林、boosting、bagging、预测。致谢：我们非常感谢两位匿名裁判的深刻评论。第二作者感谢CNPq的部分财务支持。我们还感谢弗朗西斯·X·迪博尔德、丹尼尔·博鲁普、安达德里亚·巴比伊的有益评论。1简介本文综述了机器学习（ML）方法在经济和金融时间序列预测中的最新发展。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

mingdashike22

2022-4-26 16:17:27

ML方法已成为经济学和金融学应用研究人员的重要估计、模型选择和预测工具。在大数据时代，随着海量数据集的可用性，生成可靠、稳健的预测非常重要。然而，什么是机器学习？在过去的几年里，这无疑是一个流行词，它获得了很多流行。文献中有很多定义，其中一个最为成熟的定义来自艺术情报先驱Arthur L.Samuelwho，他将ML定义为“不需要明确编程就能让计算机学习的研究领域”我们更喜欢一个不那么模糊的定义，即ML是自动计算机算法与强大的统计方法的结合，以学习（发现）丰富数据集中的隐藏模式。从这个意义上说，统计学习理论为ML提供了统计学基础。因此，本文主要讨论统计学习的发展和notML，因为我们将重点讨论统计模型。ML方法可分为三大类：监督学习、非监督学习和强化学习。这项调查是监督学习，其中的任务是学习一个函数，该函数基于作为输入输出对组织的数据，将输入（解释变量）映射到输出（因变量）。例如，回归模型就属于这一类。另一方面，无监督学习是一类ML方法，它可以发现数据集中不存在标签的未检测模式，例如聚类分析或数据压缩算法。最后，在强化学习中，代理学习在环境中执行某些操作，从而获得最大回报。它通过探索和利用所学的知识，通过反复尝试最大化回报来实现这一目标。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

kedemingshi

2022-4-26 16:17:34

这是几个艺术智能游戏玩家（比如阿尔法戈）以及连续治疗（比如强盗问题）的核心。本文介绍的监督最大似然法大致可分为两组。Firstone包括线性模型，将在第2节中讨论。我们主要关注通过正则化（也称为收缩）估计的规格。这种方法至少可以追溯到托蒂霍诺夫（1943年）。在统计学和计量经济学中，在威拉德·詹姆斯和查尔斯·斯坦（Willard James和Charles Stein）发表开创性论文，推广了统计估计中的偏差-方差权衡（Stein，1956；James和Stein，1961）之后，正则化估计器受到了关注。我们首先考虑Hoerl和Kennard（1970）提出的边缘回归估计。然后，我们给出了Tibshirani（1996）的最小绝对收缩和选择（LASSO）估计及其许多推广。我们还讨论了其他处罚。还回顾了相关数据的理论推导和影响。第二组ML技术关注非线性模型。我们在第3节中讨论了这个主题，首先介绍了一个基于筛半参数近似的统一框架。最近，因果推理的ML开始受到很多关注。然而，这项调查将不包括ML方法的因果推断。最初的一句话是“为计算机编程以从经验中学习，最终将消除对这种详细编程工作的需求。”见塞缪尔（1959）。正如格伦纳德（1981）所说。我们继续分析特定模型，作为我们总体设置的特例。更具体地说，我们涵盖了前馈神经网络，包括其浅层和深层版本和递归神经网络，以及基于树的模型，如随机森林和增强树。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

mingdashike22

2022-4-26 16:17:41

神经网络（NN）可能是最流行的ML方法之一。在我们看来，成功的部分原因是对人脑功能的错误类比。与早期文献中所吹嘘的相反，NN模型的经验成功来自一个数学事实，即大量简单基函数的线性组合能够在特定的度量选择中很好地逼近非常复杂的函数。回归树只有在发展了算法来减弱估计模型的不稳定性之后才流行起来。像随机森林和增强树这样的算法现在都在应用经济学家的工具箱里。除上述模型外，我们还对基于集合的方法进行了调查，如Bagging-Breiman（1996）和完整子集回归（Elliott等人，2013、2015）。此外，我们还简要介绍了我们称之为“混合方法”的方法，将线性和非线性模型的思想结合起来，生成新的ML预测方法。在对这些方法进行实证说明之前，我们将讨论在ML方法的背景下对超预测能力的测试。1.1一般框架快速记法：大写字母X表示随机量，小写字母X表示确定性（非随机）量。inX和x等粗体字母是为向量和矩阵等多变量对象保留的。q的符号k·KQ≥ 1表示向量的`qnorm。对于集合S，我们用| S |表示其基数。给定一个随机向量（Yt，Zt）的T个实现的样本，目标是预测h=1，H.在本文中，我们考虑以下假设：假设1（DGP）。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

kedemingshi

2022-4-26 16:17:47

让{（Yt，Zt）}∞t=1是一个协方差平稳随机过程，取值于Rd+1。因此，我们排除了通常出现在时间序列应用程序中的重要非平稳过程。特别地，假设1排除了长记忆过程中的单位根和某些类型。对于（通常预先确定的）整数p≥ 1和r≥ 0定义预测因子Xt的n维向量：=Yt-1.Yt-p、 Zt，Zt-R其中n=p+d（r+1），考虑以下直接预测模型：Yt+h=fh（Xt）+Ut+h，h=1，H、 t=1，T、（1.1）其中fh:Rn→ R是未知（可测量）函数，Ut+h:=Yt+h-fh（Xt）被假定为零均值和有限方差。通过在模型中包含截距，始终可以确保零均值条件。此外，方差模型fh可以是条件期望函数fh（x）=E（Yt+h | Xt=x），或者暗示Yt+Hon到Xt跨越的空间的最佳线性投影。无论选择哪种型号，我们的目标都是fh，因为h=1，H.由于FH未知，应根据数据进行估算。目标函数可以是单个模型，也可以是不同规格的集合，而且对于每个预测期，目标函数也可能发生重大变化。给定fh的估计值，下一步是通过估计其预测精度来评估预测方法。大多数预测准确度的衡量标准都来自随机量h（Xt）：=| bfh（Xt）-fh（Xt）|。例如，术语预测一致性指的是h（Xt）p-→ 0作为T→ ∞ 概率被认为是无条件的；A对应于其条件对应项，由h（xt）p-→ 0，其中概率定律以Xt=Xt为条件。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

何人来此

2022-4-26 16:17:53

显然，如果后者（几乎）适用于每一个XT，那么前者将遵循迭代期望定律。预测准确度的其他度量可以从无条件概率定律E导出的LQ范数中推导出来|h（Xt）| qor条件的E(|h（Xt）| q | Xt=Xt）forq≥ 1.到目前为止，使用最多的是q=1时的（条件）绝对平均预测误差（MAPE）和q=2时的（条件）均方预测误差（MSPE）或（条件）均方根预测误差（RMSPE），即MSPE的平方根。这些基于LQ范数的预测准确度指标比预测一致性指标更强，因为随着这些（q≥ 1）利用马尔可夫不等式表示预测一致性。这种方法源于将经济预测视为一个决策问题。在损失函数的选择下，目标是从一系列候选模型中选择FH，以最小化预期的预测损失或风险。给出fh的估计值，下一步是通过估计其风险来评估预测方法。最常用的损失是绝对误差和平方误差，分别对应于Land Lrisk函数。参见Grangerand Machina（2006）对该主题的详细阐述，Elliott和Timmermann（2008）对损失函数在预测中的作用的讨论，以及Elliott和Timmermann（2016）最近的综述。1.2论文摘要除了简要介绍之外，本文的组织结构如下。第2节回顾了线性回归模型。非线性ML模型将在第3节中讨论。第4节介绍了集成和杂交方法。第5节brie fly讨论了更高可预测性的测试。第6节介绍了一个经验应用。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

可人4

2022-4-26 16:18:00

最后，我们在第7节总结并讨论了未来研究的一些方向。f（Xt）是有限方差的有限支持2惩罚线性模型我们考虑线性模型族，其中f（x）=βx in（1.1）表示未知参数β的向量∈ 注册护士。请注意，为了清晰起见，我们去掉了下标h。然而，对于预测水平的特定值，必须理解模型和参数β。这些模型考虑了时间序列分析中的一系列著名规范，例如预测回归、p阶自回归模型、AR（p）、带有外生变量的自回归模型、ARX（p）、带有动态滞后ADL（p，r）的自回归模型以及其他许多模型（Hamilton，1994）。特别是，（1.1）变成t+h=βXt+Ut+h，h=1，H、 t=1，T、（2.1）其中，在平方损失下，β由Yt+honto XT的最佳线性投影确定，只要∑：=E（XTXTXT）是非奇异的，就可以很好地定义。在这种情况下，Ut+his与XTBY构造正交，利用这一性质推导出估计程序，如有序最小二乘法（OLS）。然而，当n>T（有时n T）OLS估计量不是唯一的，因为∑的样本对应项是秩不足的。事实上，我们可以完全超过≥ T惩罚线性回归出现在回归参数没有唯一定义的环境中。通常情况下，n较大，可能大于观测次数T，和/或协变量高度相关。总体思路是将OLS问题的解限制在原点附近的一个球上。可以证明，尽管存在偏差，但与非限制解相比，限制解的均方误差较小（Hastine等人，2009年，第3章和第3章）。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

nandehutu2022

2022-4-26 16:18:06

6).在惩罚回归中，未知参数向量β的估计量bβ使拉格朗日公式q（β）=T最小-hXt=1（Yt+h- βXt）+p（β），=kY- Xβk+p（β），（2.2），其中Y:=（Yh+1，…YT），X:=（X，…XT）-h） p（β）：=p（β；λ，γ，Z）≥ 0是一个取决于调谐参数λ的惩罚函数≥ 0，它控制着福利的好处和正规化条件之间的权衡。如果λ=0，我们有一个经典的无约束回归，因为p（β；0，γ，X）=0。惩罚函数也可能取决于一组超超参数γ，以及数据X。当然，估值器bβ也取决于λ和γ的选择。惩罚回归的文献中考虑了惩罚函数的不同选择。岭回归岭回归由Hoerl和Kennard（1970）提出，作为一种寻找高度相关回归系数并稳定线性回归问题解的方法。其想法是引入一个小偏差，但反过来又减少了估计量的方差。岭回归也被称为Tikhonov正则化的一个特例（Tikhonov，1943，1963；Tikhonovand Arsenin，1977），其中尺度矩阵是对角的，具有相同的条目。岭回归对应于通过参数向量的平方范数对回归进行惩罚，即（2.2）中的惩罚由p（β）=λnXi=1βi=λkβk给出。岭回归的优点是具有易于计算的解析解，其中与最小相关预测值相关的系数缩小到零，但不会精确到零。因此，除非采用某种截断方案，否则它不能用于选择预测器。最小绝对收缩和选择算子（LASSO）LASSO由Tibshirani（1996）和Chen等人（2001）提出，作为一种同时正则化和执行变量选择的方法。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

何人来此

2022-4-26 16:18:12

套索是最流行的规则化方法之一，它广泛应用于自然数n远大于观测数的数据丰富环境中。套索对应于通过参数向量的范数对回归进行惩罚，即（2.2）中的惩罚由p（β）=λnXi=1 |βi |=λkβk给出。套索的解通过坐标下降算法有效计算（Hasteet al.，2015，第5章）。惩罚是产生稀疏解的最小凸形范数。如果只有一个子集k<n系数非零，我们说解是稀疏的。换句话说，该方法只选择变量的子集。因此，当回归器的总数为n时，套索最有用测试组合或模型是不可行的。尽管套索具有诱人的性能，但它仍有局限性。为了在克服其局限性的同时保持其预期的性能，已经提出了大量替代性处罚。自适应套索自适应套索（adaLASSO）由H.Zou（2006）提出，旨在通过引入来自第一步OLS回归的权重参数来改进LASSO回归。它还具有稀疏解和高效的估计算法，但具有oracle属性，这意味着它与OLS具有相同的渐近分布，前提是知道应进入模型的变量。adaLASSO惩罚包括使用加权“惩罚：p（β）=λnXi=1ωi |βi |，其中ωi=|β”*我|-1和β*iI第一步估计的系数（β的任何一致估计）AdaLASSO可以处理比观测更多的变量。使用LASSOas，第一步估计器可以被视为Fan等人的局部线性近似的两步实现。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

可人4

2022-4-26 16:18:20

（2014年），初始估计为零。弹性网弹性网（ElNet）是邹和黑斯蒂（2005）提出的一种结合套索和脊回归的方法。当方法的Lpart执行变量选择时，Lpart稳定解决方案。当预测因子之间的相关性变得很高时，这一结论更加突出。因此，与套索相比，预测精度有了显著提高（邹和张，2009）。弹性净惩罚是`和`惩罚的凸组合：p（β）=λ“αnXi=1βi+（1- α） nXi=1 |βi |#=λ[αkβk+（1- α） kβk]，其中α∈ [0, 1]. 弹性网有套索和脊回归两种特殊情况。就像套索回归一样，弹性网问题的解是通过坐标下降算法有效地计算出来的。邹和张（2009）提出了自适应弹性网。弹性网和弹性网在不同的方向上改善了套索：弹性网和弹性网有助于预测因子之间的相关性。自适应弹性网结合了这两种方法的优点。它是ridge和Dalasso的组合，其中第一步估计量来自弹性网络。折叠凹惩罚套索方法在稀疏高维估计问题中得到了广泛应用，极大地提高了它们的计算性能。另一种非常流行的方法是Fan和Li（2001）的折叠凹面惩罚法。这种方法涵盖了一组惩罚函数，用于实现一组属性。惩罚的目的是惩罚更多接近零的参数，而不是更远的参数，从而提高方法的性能。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

mingdashike22

2022-4-26 16:18:26

这样，惩罚相对于每个|βi |是凹的。最流行的配方之一是SCAD（平滑剪裁绝对偏差）。Fan和Li（2001）首次在非目的地化的背景下描述了甲骨文财产。注意，与套索不同，惩罚可能以非线性方式依赖于λ。我们将惩罚yin（2.2）设为p（β）=Pni=1ep（βi，λ，γ），其中ep（u，λ，γ）=λ| u | if |u |≤ λ2γλ| u|-U-λ2(γ-1）如果λ≤ |u|≤ γλλ（γ+1）如果| u |>γλ，对于γ>2和λ>0。SCAD惩罚与针对小系数的套索惩罚相同，但随着系数从零开始，惩罚率会不断降低。我们必须解决一个非凸优化问题，这个问题可能具有多重性，并且比套索计算更密集。然而，Fan等人（2014年）展示了如何使用迭代局部线性近似算法计算oracle估计器。其他惩罚规则对解空间施加限制，可能施加稀疏性。在adata丰富的环境中，这是一个理想的属性，因为许多回归器可能与我们的预测问题无关。上面的演示集中于时间序列预测中最常见的惩罚。然而，在正则化线性模型中可以使用许多替代惩罚。袁和林（2006）提出的群套索将`和`规范结合起来，对群中的参数进行惩罚。它的动机是识别“因子”的问题，例如，在具有可假定许多值的分类变量的回归中，用回归器组表示。设G={G，…，gM}表示{1，…，n}和βgi=[βi:i]的一个划分∈ gi]对应的回归子向量。套索组指定（2.2）惩罚p（β）=PMi=1p | gi | kβgik，其中| gi |是集gi的基数。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

mingdashike22

2022-4-26 16:18:32

解决方案是有效估计，例如，分组优化下降算法Yang和H.Zou（2015）。当然，自适应群套索也被提出，旨在改善群套索算法Wang和Leng（2008）的一些局限性。在套索组中，各组是否进入回归。稀疏组套索通过将组套索惩罚与参数向量上的Lpenalty相结合来恢复稀疏组（Simon et al.，2013）。Park和Sakaori（2013）修改了自适应套索惩罚，以明确考虑滞后信息。Konzen和Ziegelmann（2016）提出了惩罚的一个小变化，并进行了一项大型模拟研究，以评估这种惩罚在不同环境下的表现。他们观察到，与LASSO和adaLASSO相比，考虑滞后信息可以改进模型选择和预测性能。他们将其方法应用于预测通货膨胀和风险溢价，并取得了令人满意的结果。这里介绍的正则化方法有一个贝叶斯解释。岭回归也可以看作是具有独立、等变、高斯先验的高斯线性回归的最大后验估计。套索将高斯先验替换为拉普拉斯先验（Park and Casella，2008；Hans，2009）。这些方法属于贝叶斯收缩法领域，这是一个非常大且活跃的研究领域，超出了本次调查的范围。2.1理论性质在本节中，我们概述了前面讨论的惩罚回归估计的理论性质。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

nandehutu2022

2022-4-26 16:18:38

高维时间序列估计的大多数结果都集中在有限维（n固定，但可能大于T）和高维（n随T增加，通常更快）的模型选择一致性、oracle属性和oracle界限上。更准确地说，假设存在一个总体参数向量β，它使重复样本上的等式（2.1）最小化。假设这个参数在某种意义上是稀疏的，即只有由S索引的组件 {1，…，n}是非空的。LetbS:={j:bβj6=0}。如果非零估计分量的指数收敛到Sinprobability，我们说一种方法是模型选择一致的。P（bS=S）→ 1，T→ ∞.一致性也可以用估计量与agiven范数的真参数的接近程度来表示。我们说，如果对于每种情况，估计方法都是Lq一致的 > 0:P（kbβ- βkq>) → 0，T→ ∞.值得注意的是，模型选择的一致性并不意味着Lq一致性，也不意味着Lq一致性。事实上，人们通常必须施加特定的假设，才能实现这些收敛模式中的每一种。给定估计过程的模型选择性能可以进一步细分为多少相关变量j∈ 包括在模型中（筛选）。或者有多少不相关的变量/∈ 我们被排除在模型之外。就概率而言，模型筛选一致性由P（bS）定义（S）→ 1和P（bS）定义的模型排除一致性（S）→ 1作为T→ ∞.如果一个惩罚估计的渐近分布与一个只考虑累加器的非惩罚估计的渐近分布相同，则我们认为该惩罚估计具有预言性质。最后，oracle风险界限是Bβ估计误差的有限样本界限，概率很高。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

可人4

2022-4-26 16:18:45

这些边界要求对目标函数的曲率有相对强的条件，这转化为线性模型的预测器之间的协方差矩阵的最小限制特征值的边界，以及λ上涉及非零参数数量| S |的速率条件。套索最初是在固定设计中开发的，带有独立和同分布（IID）错误，但它已被扩展并适用于大量模型，更精确的处理将分离符号一致性和模型选择一致性。符号一致性首次出现在Zhao和Yu（2006）中，也验证了估计回归权重的符号是否收敛于总体权重。设计。Knight and Fu（2000）可能是第一篇考虑套索估计量渐近性的论文。作者考虑固定设计和固定框架。从他们的结果可以清楚地看出，与无关变量相关的参数分布是非高斯的。据我们所知，将结果扩展到相关设置的第一项工作是Wang et al.（2007），其中允许误差项遵循自回归过程。作者表明，套索与模型选择一致，而与adaLASSO类似的改进套索，既与模型选择一致，又具有oracle属性。Nardi andRinaldo（2011）展示了自回归模型中滞后选择的模型选择一致性和预测一致性。Chan和Chen（2011）展示了oracle属性和模型选择ARMA模型中滞后选择的一致性。Yoon等人（2013年）推导了具有自回归误差项的惩罚回归的LASSO、adaLASSO和SCAD的模型选择一致性和渐近分布。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

何人来此

2022-4-26 16:18:51

Sang和Sun（2015）使用一般惩罚研究了具有长记忆创新的自回归过程的滞后估计，并将LASSO和SCAD作为特例展示了模型选择的一致性和渐近分布。Kock（2016）展示了adaLASSO在静态和集成过程中滞后选择的模型选择一致性和oracle特性。以上所有结果适用于固定数量的回归者或相对高维度的情况，这意味着n/T→ 0.在稀疏、高维、平稳的单变量时间序列设置中，其中n→ ∞ Medeiros和Mendes（2016年、2017年）以比T更快的速度展示了一大组具有差异鞅、强混合和非高斯创新的线性时间序列模型的模型选择一致性和预言性质。它包括预测回归、自回归模型AR（p）、具有外生变量ARX（p）的自回归模型、具有动态滞后ADL（p，r）的自回归模型，可能存在条件异方差误差。Xie等人（2017）展示了带有β-混合误差的固定设计回归的oracle界限。Wu和Wu（2016）在Wu（2005）的意义上导出了固定设计和弱相关创新的套索回归的预言界，而Han和Tsay（2020）在相同的弱相关框架下，在序列相关误差和协变量下，显示了随机设计和弱稀疏线性回归的模型选择一致性。Xue和Taniguchi（2020）展示了具有长记忆创新的时间序列回归中改进版套索的模型选择一致性和参数一致性。Fan和Li（2001）展示了固定维环境下折叠凹形惩罚估计器的模型选择一致性和oracle属性。Kim等人（2008年）表明，CAD在高维空间中也具有这些特性。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

能者818

2022-4-26 16:18:57

在时间序列设置中，Uematsu和Tanaka（2019）使用相关回归器显示了时间序列模型中的oracle属性和模型选择一致性。Lederer等人（2019年）推导了许多最终回归问题的oracle预测范围。作者的结论是，通用的高维惩罚目标提供了与任何设计矩阵一致的预测。虽然研究结果并不是直接集中在时间序列问题上，但它们足够普遍，可以在这样的环境下使用。Babii等人（2020c）提出稀疏群套索作为一种估计技术，当弱稀疏性通过假设系数（非常）小而不是完全为零来推广稀疏性时。高维时间序列数据可能以不同的频率采样。在数据分布可能具有重尾的框架内，作者导出了稀疏群LASSO估计的oracle不等式。这项调查中没有直接考虑到两个框架，但它们在实证上有很大的相关性，即非静态环境和多元模型。在稀疏、高维、集成的时间序列设置中，Lee和Z.Shi（2020）以及Koo等人（2020）展示了模型选择的一致性，并推导了LASSO估计量和一些变量的渐近分布。Smeeksand Wijler（2020）提出了单方程惩罚误差修正选择器（SPECS），这是一种针对具有大量潜在协整变量的动态单方程模型的自动估计程序。在稀疏多元时间序列中，Hsu et al.（2008）显示了具有白噪声冲击的VAR模型中的模型选择一致性。Ren and Zhang（2010）在类似的设置中使用了adaLASSO，显示了模型选择的一致性和oracle属性。之后，Callot等人（2013）展示了自适应组LASSO的模型选择一致性和Acle特性。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

mingdashike22

2022-4-26 16:19:03

在高维环境中，序列的维数随着观察次数的增加而增加，Kock和Callot（2015）；Basu and Michailidis（2015）展示了高斯V AR（p）模型中套索的oracle界限和模型选择一致性，扩展了之前的工作。Melnyk和Banerjee（2016）将这些结果推广到了大量处罚。Zhu（2020）推导了高维高斯V AR（p）模型的折叠凹惩罚的oracle估计界。最近，研究人员已经偏离了高斯性和正确的模型规范。Wong等人（2020年）在一个错误定义的VAR模型中推导出了套索的有限样本保证，该模型涉及具有次威布尔边际分布的β-混合过程。Masini等人（2019年）推导了混合依赖环境下弱稀疏Var（p）的LASSO估计的方程误差界，其中包括具有条件异方差创新的模型。2.2推论虽然有几篇论文推导了惩罚估计的渐近性质以及theoracle性质，但这些结果是在假设真非零系数足够大的情况下得出的。这种情况称为β-min限制。此外，还没有考虑模型选择，例如惩罚参数的选择。因此，在一致渐近条件下，在没有βmin限制的情况下得出的真实极限分布可能与高斯分布非常不同，甚至是双峰分布；例如，有关详细讨论，请参见Leeb and P¨otscher（2005）、Leeb and P¨otscher（2008）和Belloni等人（2014）。模型选择后的推理实际上是一个非常活跃的研究领域，最近有大量的论文出现在文献中。van de Geer等人。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

mingdashike22

2022-4-26 16:19:10

（2014）提出了离散套索，以便通过修改原始套索估计值Bβ，为每个βj，0构造（渐进）有效的置信区间。设∑*如果是∑：=E（XtXt）的近似值，则解算套索定义为β：=bβ+σ*（Y）- Xbβ）/T。将这一额外项添加到LASSO估计量中，得到一个无偏估计量，它不再精确地估计任何系数为零。更重要的是，渐近正态性可以恢复为√T（eβi）- 在适当的正则性条件下，βi，0）在分布上收敛为高斯分布。毫不奇怪，最重要的条件是∑有多好-1可近似为∑*. 特别是，作者建议运行Xionto X的n LASSOregressions-i:=（X，…，Xi）-1，Xi+1，Xn），1≤ 我≤ n、作者将这个过程命名为nodewide回归，并使用这些估计来构造∑*（详情请参阅van de Geer等人（2014）中的第2.1.1节）。Belloni等人（2014）在线性模型上提出了双重选择方法，形式为Yt=βX（1）t+βX（2）t+Ut，其中兴趣在于标度参数β和X（2）这是控制变量的高维向量。该程序考虑获得由BSA和BS分别给出的Yton X（2）和X（1）ton X（2）t的高维辅助回归中的有效（相关）回归器的估计。这可以通过套索或任何其他估算程序获得。一旦遇到挫折：=bS∪因此，可以通过低维回归Yton X（1）和{X（2）it来估计（先验）估计的非零参数：∈B}。主要结果（Belloni等人（2014）的定理1）说明了感兴趣参数的估计量Bβ适当研究渐近正态的条件。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

nandehutu2022

2022-4-26 16:19:16

因此，可以用通常的方式构造β的一致有效渐近置信区间。与Taylor等人（2014）和Lockhart等人（2014）类似，Lee等人（2016）提出了模型选择后有效推理的一般方法。其思想是描述选择事件条件下的选择后估计器的分布。更具体地说，作者认为，回归系数的选择后置信区间应根据所选模型具有正确的覆盖率。详细讨论了LASSOestimator的具体情况。Lee等人（2016年）、Taylor等人（2014年）和Lockhart等人（2014年）之间的主要区别在于，在前者中，可以根据套索惩罚参数的任何值和模型中的任何系数形成置信区间。最后，需要强调的是，Lee等人（2016年）的推理是基于所选模型的系数进行的，而van de Geer等人（2014年）和Belloni等人（2014年）则考虑了关于真实模型系数的推理。上述论文没有考虑时间序列环境。Hecq等人（2019年）发表的第一篇论文试图在时间序列环境中考虑选择后推理。作者将Belloni等人（2014）的结果推广到依赖过程。然而，他们的结果是在固定数量的变量下得出的。Babii等人（2020a）和Ad\'Amette等人（2020）将van de Geer等人（2014）的开创性工作扩展到时间序列框架。更具体地说，Babii等人（2020a）考虑了异方差和自相关误差下时间序列回归模型的推断。作者考虑了稀疏群套索的异方差性和自相关一致性（HAC）估计。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群