全部版块 我的主页
论坛 经济学人 二区 外文文献专区
14238 18
2022-06-02
英文标题:
《Constructing Metropolis-Hastings proposals using damped BFGS updates》
---
作者:
Johan Dahlin, Adrian Wills, Brett Ninness
---
最新提交年份:
2018
---
英文摘要:
  The computation of Bayesian estimates of system parameters and functions of them on the basis of observed system performance data is a common problem within system identification. This is a previously studied issue where stochastic simulation approaches have been examined using the popular Metropolis--Hastings (MH) algorithm. This prior study has identified a recognised difficulty of tuning the {proposal distribution so that the MH method provides realisations with sufficient mixing to deliver efficient convergence. This paper proposes and empirically examines a method of tuning the proposal using ideas borrowed from the numerical optimisation literature around efficient computation of Hessians so that gradient and curvature information of the target posterior can be incorporated in the proposal.
---
中文摘要:
基于观测到的系统性能数据计算系统参数及其功能的贝叶斯估计是系统辨识中的一个常见问题。这是之前研究的一个问题,其中使用流行的Metropolis-Hastings(MH)算法对随机模拟方法进行了研究。之前的这项研究发现了调整{建议分布,因此MH方法提供了充分混合的实现,以提供有效的收敛。本文提出并实证检验了一种方法,使用从数值优化文献中借用的有关Hessians有效计算的思想来调整建议,以便将目标后验的梯度和曲率信息纳入提议
---
分类信息:

一级分类:Statistics        统计学
二级分类:Computation        计算
分类描述:Algorithms, Simulation, Visualization
算法、模拟、可视化
--
一级分类:Quantitative Finance        数量金融学
二级分类:Computational Finance        计算金融学
分类描述:Computational methods, including Monte Carlo, PDE, lattice and other numerical methods with applications to financial modeling
计算方法,包括蒙特卡罗,偏微分方程,格子和其他数值方法,并应用于金融建模
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-6-2 20:46:23
使用阻尼BFGS构建大都会黑斯廷斯提案更新Johan Dahlin、Adrian Wills和Brett Ninness*2018年5月9日摘要基于观测到的系统性能数据计算系统参数及其功能的贝叶斯估计是系统识别中的常见问题。这是一个先前研究过的问题,其中使用流行的Metropolis-Hastings(MH)算法对随机模拟方法进行了研究。之前的这项研究已经确定了一个公认的调整提案分布的困难,因此MH方法提供了高效混合的实现,以实现高效的收敛。本文提出并实证检验了一种调整方案的方法,该方法使用了从数值优化文献中借用的关于黑森人高效计算的思想,以便将目标后方的梯度和曲率信息纳入方案中。关键词:贝叶斯参数推理、状态空间模型、拟牛顿、BFGS。*给作者的电子邮件地址:firstname。lastname@newcastle.edu.au.JD和AW就读于澳大利亚纽卡斯尔大学工程学院。BN在澳大利亚纽卡斯特大学工程与建筑环境学院工作。这项工作得到了澳大利亚研究委员会发现项目DP140104350.1简介的支持。状态空间模型(SSM)在许多科学学科中普遍存在,包括系统识别【Ljung,1999】和金融【Durbin和Koopman,2012】。SSMs中的一个常见问题是参数θ的估计∈ Rnθ给出了一些观测数据y1:T={y,···,yT}。在本文中,我们考虑用x表示的ssm的这个问题~ uθ(x),xt+1 | xt~ fθ(xt+1 | xt),yt | xt~ gθ(yt | xt),(1),其中|θ、fθ和gθ表示由θ参数化的已知密度。这里,xt∈ RNX和yt∈ rNude记录时间t时系统的状态和观测值。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-2 20:46:26
请注意,此参数化(1)包括大多数非线性和非高斯SSM以及输入ut∈ rnuca可以作为fθ和gθ的参数添加。估算(1)中θ的一种常用方法是采用隐含的一步预测分布pθ(yt | yt-1) 形成似然π(θ)=pθ(y1:T)=pθ(y)TYt=2pθ(yt | y1:T-1) ,(2)的观测数据。然后,通过似然的最大化参数给出θ的估计,即bθML=arg maxθpθ(y1:T),(3),这是众所周知的最大似然(ML)估计【Ljung,1999】。实际上,pθ(yt | yt-1) 可用于大多数SSM,但可使用粒子方法进行无偏估计【Doucet和Johansen,2011年】,这些方法可用于基于梯度的优化【Poyiadjis等人,2011年】和期望-最大化算法【Sch¨on等人,2011年】中,以近似解决(3)中的非对流可处理问题。在本文中,我们采用另一种方法,通过使用贝叶斯范式来估计θ【Peterka,1981,Robert,2007】。这相当于计算后验概率(θ| y1:T)∝ pθ(y1:T)p(θ),(4),其中p(θ)是θ的先验分布,可用于编码有关参数的先验用户信息。然而,这种后验概率很难计算,因为无法以闭合形式计算可能性(2)。相反,我们利用一种随机模拟方法来解决这个难题,它构造了一个随机数生成器,使得θk~ π(θ). (5) 这是统计文献中广泛应用的方法,在过去十年中,它在应用中的使用呈爆炸式增长。构建合适的随机数生成器的标准方法是采用(粒子)Metropolis-Hastings(MH;Robert and Casella,2004,Andrieu et al.,2010),这是一种非常通用的算法,用于计算π(θ)的实现,前提是可以逐点计算。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-2 20:46:29
不幸的是,实现合理的收敛需要仔细调整算法,这本质上需要利用未知后验值的信息。这一困难在文献中得到了很好的认可,通常通过采用自适应方法【Andrieu和Thoms,2008】和几何信息的加入【Girolami和Calderhead,2011】来缓解。后一种方法需要计算对数后验的Hessian值,即使对于适用标准Kalman方法的线性高斯SSM,也很难直接计算。当使用粒子方法【Doucet和Johansen,2011】来估计潜在状态和可能性时,问题就更糟了。这是经验观察的结果,即使用粒子方法获得的Hessian估计值通常是有噪声的,甚至使用大量粒子也不准确。然而,有时即使使用少量粒子,梯度估计也很精确。因此,研究利用噪声梯度信息估计黑森值的问题很有意义。本文的贡献是探索使用阻尼Brodyen–Fletcher–Goldfarb–Shanno(BFGS)更新,仅使用梯度信息近似由Hessian编码的局部曲率。Ths是解决光滑数值优化问题的一种广泛使用的方法【Nocedal和Wright,2006年】。有关在MH内使用BFGS的相关工作包括Zhang和Sutton【2011年】,作者将这一想法应用于回归问题。Dahlin等人【2015b】将这项工作扩展到一类具有难处理可能性的SSM。本文的主要创新之处在于使用阻尼BFGS更新,以确保即使采用粒子方法,Hessian也是正半有限的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-2 20:46:33
最后,与早期在MH内使用BFG的尝试相比,所提出的方法提供了优异的性能。因此,我们获得了良好的MH性能,无需繁琐的用户调整,这是迈向自动贝叶斯推理方法的一步。2后验抽样存在一套所谓的马尔可夫链蒙特卡罗(MCMC;Robert和Casella,2004)方法,用于构建马尔可夫链,生成具有用户指定不变分布π(θ)的实现{θk}。由于在温和的假设下,马尔可夫链的实现具有收敛于链的变分分布的分布,因此这提供了一种构建具有任意目标分布π的随机数生成器(5)的方法。然后可以使用这些样本来近似后验值。给出后验点估计,如条件平均值bθCM=Eθy1:T=可以得到Zθπ(θ)dθ,(6)。这些都是有趣的,因为它们具有最小均方误差特性,并且不依赖于作为ML估计的渐近结果(3)。此外,通过计算(边缘)后验密度(θi | y1:T)=Zπ(θ)dθ,可以获得估计参数向量的每个元素i的误差界-i、 (7)式中θ-IDE注意到没有第i个元素的向量θ。不幸的是,(6)和(7)都需要对多维积分进行评估,这在计算上可能具有挑战性,尤其是当nθ=dim{θ}增长时。这导致任何任意(可测量)函数的期望值Д:Rnθ→ 由π[Д]=E[Д(θ)]=ZД(θ)π(θ)dθ给出的R,可以使用随机数生成器中的样本用bπK[Д]=KKXk=1Д(θK),(8)来近似。此外,我们还发现,估计量服从强大数定律,并且是一致的,即bπK[Д]a.s。-→ π[Д],K→ ∞.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-2 20:46:37
(9) 选择Д(θ)=θ,然后给出条件平均值估计(6)的近似值,选择Д(θ)作为适当的指示函数,然后给出π(θ)的近似值作为样本直方图。MH算法可以说是实现算法1 Metropolis Hastings(MH)输入:K>0,θ和q的最广泛使用的MCMC技术之一。输出:{θ,…,θK}。1: 计算π(θ)。2: 对于k=1至k do3:样品θ~ q(θ|θk-1) 使用(10)。4: 使用卡尔曼或粒子方法计算π(θ)。5: [0,1]上的ωkuniformly样本。6: 如果ωk≤ min{1,α(θ,θk-1) }由(11)给出。然后7:接受θ,即θk← θ.8: else9:拒绝θ,即θk← θk-1.10:结束if11:结束(5)。它通过采用任意建议马尔可夫链q(θk |θk)进行操作-1) 并通过随机接受来自该基链的实现来调节它。接受概率取决于目标π(θ)。在理论上(但不是在实践中),可以非常自由地选择提案分布,但在大多数情况下,使用高斯提案,qθ|θk-1.= Nθ; uθk-1., Σθk-1., (10) 其中θ表示候选参数,u和∑分别表示均值和协方差函数。通过(10)生成候选参数后,接受概率为α(θ,θk-1) = 1 ∧π(θ)π(θk-1) q(θk-1 |θ)q(θ|θk-1) ,(11)其中∧ b=最小值(a,b)。我们设置θk← θ如果候选参数被接受,θk← θk-1如果弹出。注意,我们只需要能够逐点计算π(θ)就可以实现算法1中所述的MH。一个关键点是,收敛速度(9)取决于实现{Д(θk)}的相关性。不相关程度越高,收敛速度越快,因此对于给定的有限个实现数K,近似值(8)越好。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群