全部版块 我的主页
论坛 经济学人 二区 外文文献专区
1670 41
2022-06-10
英文标题:
《Parameter Estimation of Heavy-Tailed AR Model with Missing Data via
  Stochastic EM》
---
作者:
Junyan Liu, Sandeep Kumar, and Daniel P. Palomar
---
最新提交年份:
2019
---
英文摘要:
  The autoregressive (AR) model is a widely used model to understand time series data. Traditionally, the innovation noise of the AR is modeled as Gaussian. However, many time series applications, for example, financial time series data, are non-Gaussian, therefore, the AR model with more general heavy-tailed innovations is preferred. Another issue that frequently occurs in time series is missing values, due to system data record failure or unexpected data loss. Although there are numerous works about Gaussian AR time series with missing values, as far as we know, there does not exist any work addressing the issue of missing data for the heavy-tailed AR model. In this paper, we consider this issue for the first time, and propose an efficient framework for parameter estimation from incomplete heavy-tailed time series based on a stochastic approximation expectation maximization (SAEM) coupled with a Markov Chain Monte Carlo (MCMC) procedure. The proposed algorithm is computationally cheap and easy to implement. The convergence of the proposed algorithm to a stationary point of the observed data likelihood is rigorously proved. Extensive simulations and real datasets analyses demonstrate the efficacy of the proposed framework.
---
中文摘要:
自回归(AR)模型是一种广泛用于理解时间序列数据的模型。传统上,AR的新息噪声被建模为高斯噪声。然而,许多时间序列应用,例如金融时间序列数据,都是非高斯的,因此,具有更一般的重尾创新的AR模型是首选。时间序列中经常出现的另一个问题是由于系统数据记录失败或意外数据丢失而丢失值。虽然有许多关于缺失值高斯AR时间序列的工作,但据我们所知,没有任何工作解决重尾AR模型的缺失数据问题。本文首次考虑了这一问题,提出了一种基于随机近似期望最大化(SAEM)和马尔可夫链蒙特卡罗(MCMC)过程的不完全重尾时间序列参数估计的有效框架。该算法计算量小,易于实现。严格证明了该算法收敛于观测数据似然的平稳点。大量的仿真和实际数据集分析证明了该框架的有效性。
---
分类信息:

一级分类:Statistics        统计学
二级分类:Applications        应用程序
分类描述:Biology, Education, Epidemiology, Engineering, Environmental Sciences, Medical, Physical Sciences, Quality Control, Social Sciences
生物学,教育学,流行病学,工程学,环境科学,医学,物理科学,质量控制,社会科学
--
一级分类:Electrical Engineering and Systems Science        电气工程与系统科学
二级分类:Signal Processing        信号处理
分类描述:Theory, algorithms, performance analysis and applications of signal and data analysis, including physical modeling, processing, detection and parameter estimation, learning, mining, retrieval, and information extraction. The term \"signal\" includes speech, audio, sonar, radar, geophysical, physiological, (bio-) medical, image, video, and multimodal natural and man-made signals, including communication signals and data. Topics of interest include: statistical signal processing, spectral estimation and system identification; filter design, adaptive filtering / stochastic learning; (compressive) sampling, sensing, and transform-domain methods including fast algorithms; signal processing for machine learning and machine learning for signal processing applications; in-network and graph signal processing; convex and nonconvex optimization methods for signal processing applications; radar, sonar, and sensor array beamforming and direction finding; communications signal processing; low power, multi-core and system-on-chip signal processing; sensing, communication, analysis and optimization for cyber-physical systems such as power grids and the Internet of Things.
信号和数据分析的理论、算法、性能分析和应用,包括物理建模、处理、检测和参数估计、学习、挖掘、检索和信息提取。“信号”一词包括语音、音频、声纳、雷达、地球物理、生理、(生物)医学、图像、视频和多模态自然和人为信号,包括通信信号和数据。感兴趣的主题包括:统计信号处理、谱估计和系统辨识;滤波器设计;自适应滤波/随机学习;(压缩)采样、传感和变换域方法,包括快速算法;用于机器学习的信号处理和用于信号处理应用的机器学习;网络与图形信号处理;信号处理中的凸和非凸优化方法;雷达、声纳和传感器阵列波束形成和测向;通信信号处理;低功耗、多核、片上系统信号处理;信息物理系统的传感、通信、分析和优化,如电网和物联网。
--
一级分类:Mathematics        数学
二级分类:Optimization and Control        优化与控制
分类描述:Operations research, linear programming, control theory, systems theory, optimal control, game theory
运筹学,线性规划,控制论,系统论,最优控制,博弈论
--
一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-6-10 18:49:53
通过随机EMJunyan Liu、Sandeep Kumar和Daniel P.Palomar,Fellow,IEEEAbstract估计缺失数据的重尾AR模型自回归(AR)模型是一种广泛用于理解时间序列数据的模型。传统上,AR的新息噪声被建模为高斯噪声。然而,许多时间序列应用,例如,金融时间序列数据,阿伦-高斯,因此,具有更一般的重尾创新的AR模型是首选。时间序列中经常出现的另一个问题是由于系统数据记录故障或预期的数据丢失而丢失值。虽然有很多关于高斯AR时间序列缺失值的研究,但据我们所知,对于重尾AR模型,还没有任何研究解决缺失数据的问题。在本文中,我们首次考虑了这个问题,并提出了一个基于随机近似期望最大化(SAEM)和马尔可夫链蒙特卡罗(MCMC)过程的不完全重尾时间序列参数估计的有效框架。该算法计算成本低,易于实现。严格证明了该算法收敛于观测数据似然的平稳点。大量仿真和实际数据集分析证明了所提出框架的有效性。指标项AR模型、重尾、缺失值、SAEM、马尔可夫链蒙特卡罗、收敛性分析。简介在最近的数据欺骗时代,许多应用程序收集和处理时间序列数据,用于推理、学习、参数估计和决策。自回归(AR)模型是分析时间序列数据的常用模型,在这种情况下,在时间上密切观测的观测值在统计上依赖于其他观测值。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-10 18:49:56
在AR时间序列中,每个样本都是一些先前观测值与惊人创新的线性组合。阶数为p、AR(p)的AR模型,定义为asyt=Д+pXi=1Дiyt-i+εt,(1)其中ytis是第t次观测,Д是常数,Дi的面积自回归系数,ε是与第t次观测相关的创新。AR模型已成功应用于许多实际应用中,如DNA微阵列数据分析[1]、EEG信号建模[2]、金融时间序列分析[3]和动物预测研究[4],等等。传统上,AR模型的创新εtof假设dt为高斯分布,由于AR模型的线性,这意味着观测结果也是如此。这项工作得到了香港RGC 16208917研究基金的支持。作者来自香港科技大学(香港)(电子邮件:jliubl@connect.ust.hk; eesandeep@ust.hk; palomar@ust.hk).高斯分布。然而,在信号处理和金融市场的应用中,由于内部数据生成机制或异常值的存在,存在时间序列为非高斯和重尾的情况。例如,stoc k返回[3]、[5]、功能磁共振成像中的bra[6]、[7]和动物种群中的黑天鹅事件[4]。对于这些情况,可以寻求一个A R模型,其创新遵循重尾分布,如学生的t分布。学生的t分布是最常用的重尾分布之一[8]。[9]和[10]的作者考虑了一个AR模型,该模型的创新点遵循了已知自由度数的学生t分布,而[11]和[12]则研究了未知自由度数的ca se。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-10 18:49:59
Student的T A Rmodel在重尾AR时间序列中表现良好,并且可以在出现异常值时提供回归系数的稳健可靠估计。另一个在实践中经常出现的问题是在数据观测或记录过程中丢失值。可能导致缺失值的原因有很多:值可能无法测量,值可能被测量但丢失,或值可能被测量但被认为不可用[13]。现实世界中的一些情况是:一些仓库可能出现流动性不足,导致没有交易,因此没有记录价格,传感器等观测设备可能在测量过程中发生故障,天气或其他条件干扰采样计划。因此,研究具有缺失值的AR时间序列具有重要意义。尽管有许多工作考虑了具有缺失值的高斯AR时间序列【14】–【17】,但对具有缺失值的重尾AR时间序列的关注较少,因为在这种情况下,由于难以解决的公式化问题,参数估计很复杂。在【9】–【12】中,用于重尾AR时间序列参数估计的fr方法需要完整的数据,因此,不适合缺少数据的场景。本文的目标是应对这一挑战,并通过期望最大化(e M)型算法开发一个有效的框架,用于在重尾tim e系列模型下从不完整数据进行参数估计。EM算法是一种广泛使用的迭代方法,用于在存在缺失值或未观测到的潜在变量时获得参数的最大似然(ML)估计。在每次迭代中,EM算法最大化完整数据可能性的条件期望以更新估计值。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-10 18:50:02
EM alg算法的许多变体已被提出,以应对不同缺失值问题中的特定挑战。例如,为了解决完全数据对数似然的条件期望的难处理性所带来的问题,EM算法的一个随机变量在[18]、[19]中提出,该算法通过从条件分布中抽取潜在变量的样本来逼近期望。由于随机EM算法的计算复杂度低于EM算法,因此它在抑制维数变化方面也很受欢迎[14],[20]。有人建议使用预期条件最大化(ECM)算法来处理像EliHo od这样的预期完整数据日志的闭合形式最大化器不可用的问题【21】。正则化EM算法已用于在参数估计中实施某些结构,如稀疏性、低秩和网络结构[22]。在本文中,我们建立了一个可证明收敛的低成本算法框架,用于从不完全时间序列估计具有重尾新息的AR时间序列模型的参数估计。据我们所知,对于这类问题不存在任何收敛的算法框架。在【9】–【11】之后,我们考虑了具有学生t分布创新的AR模型。我们提出了一个M L估计问题,并基于随机EM框架开发了一种有效的算法来获得参数s的M L估计。为了克服潜在变量条件分布的复杂性,我们提出了一种Gibbs抽样方案来生成样本。该算法不需要直接从复杂的条件分布中采样,只需从高斯分布和gamma分布中交替采样即可。建立了该算法到稳定点的收敛性。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-10 18:50:05
对真实数据和合成数据的仿真结果表明,该框架能够对不完整时间序列提供准确的参数估计,并对可能出现的异常值具有鲁棒性。虽然这里我们只关注学生的t分布创新,但提出的方法和算法的思想也可以推广到具有其他重尾分布的AR模型。本文的组织结构如下。第二节提供了问题公式。第三节介绍了EM及其随机变量的回顾。第四节推导了所提出的算法。第五节进行了收敛性分析。最后,第六节提供了所提出算法应用于真实数据和合成数据的仿真结果,第七节总结了本文。二、问题公式为简化符号,我们首先介绍AR(1)模型。假设一个单变量时间序列y,y。,YTFlowsan AR(1)型号yt=Д+Дyt-1+εt,(2)其中创新εt遵循零平均重尾学生t分布εti。i、 d。~ t型0, σ, ν. 随着自由度ν的减少,学生的t分布更重尾。注意,高斯分布是学生t分布的特殊情况,ν=+∞.给定所有参数rsν、ν、σ和ν,yt的d分布取决于所有前面的数据Ft-1,由y,y。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群