全部版块 我的主页
论坛 经济学人 二区 外文文献专区
1417 58
2022-06-01
英文标题:
《Model Misspecification in ABC: Consequences and Diagnostics》
---
作者:
David T. Frazier, Christian P. Robert and Judith Rousseau
---
最新提交年份:
2019
---
英文摘要:
  We analyze the behavior of approximate Bayesian computation (ABC) when the model generating the simulated data differs from the actual data generating process; i.e., when the data simulator in ABC is misspecified. We demonstrate both theoretically and in simple, but practically relevant, examples that when the model is misspecified different versions of ABC can yield substantially different results. Our theoretical results demonstrate that even though the model is misspecified, under regularity conditions, the accept/reject ABC approach concentrates posterior mass on an appropriately defined pseudo-true parameter value. However, under model misspecification the ABC posterior does not yield credible sets with valid frequentist coverage and has non-standard asymptotic behavior. In addition, we examine the theoretical behavior of the popular local regression adjustment to ABC under model misspecification and demonstrate that this approach concentrates posterior mass on a completely different pseudo-true value than accept/reject ABC. Using our theoretical results, we suggest two approaches to diagnose model misspecification in ABC. All theoretical results and diagnostics are illustrated in a simple running example.
---
中文摘要:
我们分析了当生成模拟数据的模型与实际数据生成过程不同时,近似贝叶斯计算(ABC)的行为;i、 例如,当ABC中的数据模拟器指定错误时。我们在理论上和简单但实际相关的例子中都证明,当模型被错误指定时,不同版本的ABC可以产生实质上不同的结果。我们的理论结果表明,即使模型被错误指定,在规则性条件下,接受/拒绝ABC方法将后部质量集中在适当定义的伪真参数值上。然而,在模型错误指定的情况下,ABC后验不能产生具有有效频率覆盖的可信集,并且具有非标准的渐近行为。此外,我们检验了在模型错误指定情况下流行的局部回归调整ABC的理论行为,并证明这种方法将后验质量集中在与接受/拒绝ABC完全不同的伪真值上。利用我们的理论结果,我们提出了两种诊断ABC中模型错误的方法。所有理论结果和诊断都在一个简单的运行示例中进行了说明。
---
分类信息:

一级分类:Mathematics        数学
二级分类:Statistics Theory        统计理论
分类描述:Applied, computational and theoretical statistics: e.g. statistical inference, regression, time series, multivariate analysis, data analysis, Markov chain Monte Carlo, design of experiments, case studies
应用统计、计算统计和理论统计:例如统计推断、回归、时间序列、多元分析、数据分析、马尔可夫链蒙特卡罗、实验设计、案例研究
--
一级分类:Quantitative Finance        数量金融学
二级分类:Economics        经济学
分类描述:q-fin.EC is an alias for econ.GN. Economics, including micro and macro economics, international economics, theory of the firm, labor economics, and other economic topics outside finance
q-fin.ec是econ.gn的别名。经济学,包括微观和宏观经济学、国际经济学、企业理论、劳动经济学和其他金融以外的经济专题
--
一级分类:Statistics        统计学
二级分类:Methodology        方法论
分类描述:Design, Surveys, Model Selection, Multiple Testing, Multivariate Methods, Signal and Image Processing, Time Series, Smoothing, Spatial Statistics, Survival Analysis, Nonparametric and Semiparametric Methods
设计,调查,模型选择,多重检验,多元方法,信号和图像处理,时间序列,平滑,空间统计,生存分析,非参数和半参数方法
--
一级分类:Statistics        统计学
二级分类:Statistics Theory        统计理论
分类描述:stat.TH is an alias for math.ST. Asymptotics, Bayesian Inference, Decision Theory, Estimation, Foundations, Inference, Testing.
Stat.Th是Math.St的别名。渐近,贝叶斯推论,决策理论,估计,基础,推论,检验。
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-6-1 05:20:45
ABC中的模型规格错误:序列和诊断。*David T.Frazier+、Christian P.Robert和Judith Rousseau§2019AbstractWe分析了模型生成模拟数据时近似贝叶斯计算(ABC)的行为与实际数据生成过程不同;i、 例如,当ABC中的数据模拟器被错误指定时。我们在理论上和简单但实际相关的例子中证明,当模型被错误指定时,不同版本的ABC可以产生实质性不同的结果。我们的理论结果表明,即使模型定义错误,在规则性条件下,接受/拒绝ABCapproach将后验概率集中在适当定义的伪真参数值上。然而,在模型误判下,ABC后验不能产生具有有效频率覆盖率的可信集,并且具有非标准的渐近行为。此外,我们还研究了流行的局部回归调整ABC模型下的误判的理论行为,并证明这种方法将后验质量集中在与接受/拒绝ABC完全不同的伪真值上。利用我们的理论结果,我们提出了两种诊断ABC中模型错误的方法。所有理论结果和诊断都在一个简单的运行示例中进行了说明。关键词:无似然法、模型误判、近似贝叶斯计算(ABC)、渐近性、回归调整ABC*我们要感谢编辑David Dunson,一位副编辑和两位匿名推荐人的建设性评论,这些评论极大地改进了论文。+澳大利亚墨尔本莫纳什大学。电子邮件:david。frazier@monash.edu.巴黎多芬大学巴黎分校,Ceremake CNRS,巴黎,法国。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 05:20:48
电子邮件:xian@cerema德多芬。fr§牛津大学,巴黎多芬大学,法国巴黎Ceremake CNRS。电子邮件:rousseau@ceremade.dauphine.fr1在天文、生态和遗传科学以及经济学和金融学中,用于描述观测数据的模型非常复杂,因此与这些模型相关的可能性在计算上很难解决。在贝叶斯推理范式中,这些情况导致了近似贝叶斯计算(ABC)方法的兴起,该方法避免了可能性计算,而支持模拟;有关ABC方法的审查,请参见Marin et al.(2012)、Robert(2016)和Sisson et al.(2018)。ABC的前提是,观测数据y:=(y,y,…,yn)来自模型类{θ∈ Θ:Pnθ},其中θ∈ Θ  Rkθ是未知的参数向量,其中π(θ)描述了我们对θ的先验信念。ABC的目标是通过模拟伪数据z,z:=(z,…,zn)对未知θ进行推理, 从Pnθ开始,然后“比较”y和z。在大多数情况下,这种比较是使用汇总统计向量η(·)和度量d(·,·)进行的。一般来说,在ABC中,θ的值是可接受的,如果它们满足取决于公差参数的接受规则,则用于建立精确后验值的近似值。算法1 ABC算法1:模拟θi,i=1,2。。。,N、 从π(θ),2:模拟zi=(zi,zi,…,zin), i=1,2。。。,N、 来自Pnθi;3: 对于每个i=1。。。,N、 接受θiif d(η(zi),η(y))≤ 其中,表示用户选择的公差参数。算法1详细说明了ABC的常见接受/拒绝实现,可以通过额外的步骤来增加采样效率;例如,参见Marjoram et al.(2003)的MCMC-ABC方法,或Sisson et a l.(20 07)的SMC-ABC方法。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 05:20:51
还提出了模拟对{θi,η(zi)}的后处理方法,以获得更精确的后验近似值(例如,见Beaumont et al.,2002的局部线性回归调整方法,Nott et al.,2014的边际调整方法,或Rodrigues et al.,2018的再校准方法)。虽然存在几种后处理策略,但最常见的方法是所谓的局部线性回归调整(Beaumont et al.,2002),它涉及使用线性回归模型对算法1的输出进行后处理,以改进所得的后验近似值;我们请感兴趣的读者参阅Blum(2018),了解ABC中回归调整方法的概述。对于{θi,η(zi)}i≥1基于算法1,从ABC后验中选取样本,局部线性回归调整使用样本{θi,η(zi)}i≥1生成调整后的后验样本{θi-^β[η(z)- η(y)]}i≥1,其中^β是从θ离子{η(zi)的回归中获得的- η(y)}。无论选择哪种ABC算法,ABC的本质是,研究人员必须相信,在先前的支持中存在θ值,可以生成“接近”观察到的总结η(y)的模拟总结η(z)。因此,为了让ABC产生关于θ的有意义的推断,必须存在θ的值∈ Θ使得η(z)和η(y)相似。虽然复杂的模型允许我们解释观测数据的许多特征,但不可能有任何研究人员能够构建一个能够完美再现y的所有特征的模型Pnθ。换句话说,根据应用ABC的复杂模型的本质,模型类{θ∈ Θ:Pnθ}用于模拟伪数据z,可能有误。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 05:20:54
即使考虑到汇总统计数据的使用不充分,并且可能与几个模型兼容,这些汇总数据对观察数据的价值也可能与假设模型中这些统计数据的实际值不兼容,即极不可能。考虑到实证应用中模型误判的可能性,了解流行ABC方法在模型误判下的行为,以及这种行为的后果,对从业者来说至关重要。如以下示例所示,模型误判的一个特殊后果是,不同的ABC方法可能会产生显著不同的结果。示例1:考虑一个特别简单的示例,其中假定的数据生成过程(DGP)为z,zniid为N(θ,1),但实际DGP为y,yniid为N(θ,σ)。也就是说,对于σ6=1,假设的DGP对观测数据的方差保持了错误的假设。我们将以下汇总统计数据作为ABC分析的基础:o样本平均数η(y)=nPni=1yi,o样本方差η(y)=n-1Pni=1(yi-η(y))。考虑根据ABC的两个版本对θ进行推断:接受/拒绝方法(以下简称ABC-AR),其中我们取d(x,y)=kx- yk是欧几里德范数,是ABC的局部线性回归调整方法(以下简称ABC Reg)。ABC Reg使用θ离子{η(zi)的加权线性回归调整来自ABC-AR的已接受图纸- η(y)},带权重K(Kη(zi)- η(y)k),其中k(·)是核函数,其中公差运算是核函数的带宽。遵循Beaumont et a l。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 05:20:57
(20 02),我们将其视为核函数K(t),Epanechnikov核:K(t)=1lt≤·c-1(1 - (t/)),其中1lt≤表示事件t上的指示器功能≤ 其中c是一个归一化常数。为了确定这两种ABC方法在不同模型误判水平下的表现,我们确定θ=1,并根据σ的不同值模拟“观测数据”。整个实验的样本大小取n=100。我们考虑y的一系列模拟数据集,每个数据集对应于σ的不同值,σ取σ=。5至σ=5,均匀间隔增量为0.05。在所有数据集中,我们确定了用于生成模拟观测数据的随机数,并仅改变σ值,以隔离模型误判的影响;i、 例如,我们生成一组公共的随机数νi~ N(0,1),i=1。。。,100,则对于σ值,我们根据yi=1+νi·σ生成观测数据。我们的先验信念由θ给出~ N(0,25)。我们使用N=25000个根据zji生成的iid模拟伪数据集来实现ABC-AR~ N(θj,1)。对于ABC-AR和BC Reg,我们将设置为模拟距离kη(y)的1%分位数- η(zj)k.为了进一步隔离随机性对该过程的影响,我们在不同的观测数据集中使用相同的模拟数据;i、 例如,两个ABC程序将在σ的不同值上使用相同的模拟数据。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群