ABC中的模型规格错误：后果和诊断

2022-6-1 05:20:45

ABC中的模型规格错误：序列和诊断。*David T.Frazier+、Christian P.Robert和Judith Rousseau§2019AbstractWe分析了模型生成模拟数据时近似贝叶斯计算（ABC）的行为与实际数据生成过程不同；i、例如，当ABC中的数据模拟器被错误指定时。我们在理论上和简单但实际相关的例子中证明，当模型被错误指定时，不同版本的ABC可以产生实质性不同的结果。我们的理论结果表明，即使模型定义错误，在规则性条件下，接受/拒绝ABCapproach将后验概率集中在适当定义的伪真参数值上。然而，在模型误判下，ABC后验不能产生具有有效频率覆盖率的可信集，并且具有非标准的渐近行为。此外，我们还研究了流行的局部回归调整ABC模型下的误判的理论行为，并证明这种方法将后验质量集中在与接受/拒绝ABC完全不同的伪真值上。利用我们的理论结果，我们提出了两种诊断ABC中模型错误的方法。所有理论结果和诊断都在一个简单的运行示例中进行了说明。关键词：无似然法、模型误判、近似贝叶斯计算（ABC）、渐近性、回归调整ABC*我们要感谢编辑David Dunson，一位副编辑和两位匿名推荐人的建设性评论，这些评论极大地改进了论文。+澳大利亚墨尔本莫纳什大学。电子邮件：david。frazier@monash.edu.巴黎多芬大学巴黎分校，Ceremake CNRS，巴黎，法国。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

mingdashike22

2022-6-1 05:20:48

电子邮件：xian@cerema德多芬。fr§牛津大学，巴黎多芬大学，法国巴黎Ceremake CNRS。电子邮件：rousseau@ceremade.dauphine.fr1在天文、生态和遗传科学以及经济学和金融学中，用于描述观测数据的模型非常复杂，因此与这些模型相关的可能性在计算上很难解决。在贝叶斯推理范式中，这些情况导致了近似贝叶斯计算（ABC）方法的兴起，该方法避免了可能性计算，而支持模拟；有关ABC方法的审查，请参见Marin et al.（2012）、Robert（2016）和Sisson et al.（2018）。ABC的前提是，观测数据y：=（y，y，…，yn）来自模型类{θ∈ Θ：Pnθ}，其中θ∈ Θ Rkθ是未知的参数向量，其中π（θ）描述了我们对θ的先验信念。ABC的目标是通过模拟伪数据z，z:=（z，…，zn）对未知θ进行推理, 从Pnθ开始，然后“比较”y和z。在大多数情况下，这种比较是使用汇总统计向量η（·）和度量d（·，·）进行的。一般来说，在ABC中，θ的值是可接受的，如果它们满足取决于公差参数的接受规则，则用于建立精确后验值的近似值。算法1 ABC算法1：模拟θi，i=1，2。。。，N、从π（θ），2：模拟zi=（zi，zi，…，zin）, i=1，2。。。，N、来自Pnθi；3：对于每个i=1。。。，N、接受θiif d（η（zi），η（y））≤ 其中，表示用户选择的公差参数。算法1详细说明了ABC的常见接受/拒绝实现，可以通过额外的步骤来增加采样效率；例如，参见Marjoram et al.（2003）的MCMC-ABC方法，或Sisson et a l.（20 07）的SMC-ABC方法。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-6-1 05:20:51

还提出了模拟对{θi，η（zi）}的后处理方法，以获得更精确的后验近似值（例如，见Beaumont et al.，2002的局部线性回归调整方法，Nott et al.，2014的边际调整方法，或Rodrigues et al.，2018的再校准方法）。虽然存在几种后处理策略，但最常见的方法是所谓的局部线性回归调整（Beaumont et al.，2002），它涉及使用线性回归模型对算法1的输出进行后处理，以改进所得的后验近似值；我们请感兴趣的读者参阅Blum（2018），了解ABC中回归调整方法的概述。对于{θi，η（zi）}i≥1基于算法1，从ABC后验中选取样本，局部线性回归调整使用样本{θi，η（zi）}i≥1生成调整后的后验样本{θi-^β[η（z）- η（y）]}i≥1，其中^β是从θ离子{η（zi）的回归中获得的- η（y）}。无论选择哪种ABC算法，ABC的本质是，研究人员必须相信，在先前的支持中存在θ值，可以生成“接近”观察到的总结η（y）的模拟总结η（z）。因此，为了让ABC产生关于θ的有意义的推断，必须存在θ的值∈ Θ使得η（z）和η（y）相似。虽然复杂的模型允许我们解释观测数据的许多特征，但不可能有任何研究人员能够构建一个能够完美再现y的所有特征的模型Pnθ。换句话说，根据应用ABC的复杂模型的本质，模型类{θ∈ Θ：Pnθ}用于模拟伪数据z，可能有误。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-6-1 05:20:54

即使考虑到汇总统计数据的使用不充分，并且可能与几个模型兼容，这些汇总数据对观察数据的价值也可能与假设模型中这些统计数据的实际值不兼容，即极不可能。考虑到实证应用中模型误判的可能性，了解流行ABC方法在模型误判下的行为，以及这种行为的后果，对从业者来说至关重要。如以下示例所示，模型误判的一个特殊后果是，不同的ABC方法可能会产生显著不同的结果。示例1：考虑一个特别简单的示例，其中假定的数据生成过程（DGP）为z，zniid为N（θ，1），但实际DGP为y，yniid为N（θ，σ）。也就是说，对于σ6=1，假设的DGP对观测数据的方差保持了错误的假设。我们将以下汇总统计数据作为ABC分析的基础：o样本平均数η（y）=nPni=1yi，o样本方差η（y）=n-1Pni=1（yi-η（y））。考虑根据ABC的两个版本对θ进行推断：接受/拒绝方法（以下简称ABC-AR），其中我们取d（x，y）=kx- yk是欧几里德范数，是ABC的局部线性回归调整方法（以下简称ABC Reg）。ABC Reg使用θ离子{η（zi）的加权线性回归调整来自ABC-AR的已接受图纸- η（y）}，带权重K（Kη（zi）- η（y）k），其中k（·）是核函数，其中公差运算是核函数的带宽。遵循Beaumont et a l。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

mingdashike22

2022-6-1 05:20:57

（20 02），我们将其视为核函数K（t），Epanechnikov核：K（t）=1lt≤·c-1(1 - （t/）），其中1lt≤表示事件t上的指示器功能≤ 其中c是一个归一化常数。为了确定这两种ABC方法在不同模型误判水平下的表现，我们确定θ=1，并根据σ的不同值模拟“观测数据”。整个实验的样本大小取n=100。我们考虑y的一系列模拟数据集，每个数据集对应于σ的不同值，σ取σ=。5至σ=5，均匀间隔增量为0.05。在所有数据集中，我们确定了用于生成模拟观测数据的随机数，并仅改变σ值，以隔离模型误判的影响；i、例如，我们生成一组公共的随机数νi~ N（0，1），i=1。。。，100，则对于σ值，我们根据yi=1+νi·σ生成观测数据。我们的先验信念由θ给出~ N（0，25）。我们使用N=25000个根据zji生成的iid模拟伪数据集来实现ABC-AR~ N（θj，1）。对于ABC-AR和BC Reg，我们将设置为模拟距离kη（y）的1%分位数- η（zj）k.为了进一步隔离随机性对该过程的影响，我们在不同的观测数据集中使用相同的模拟数据；i、例如，两个ABC程序将在σ的不同值上使用相同的模拟数据。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

2022-6-1 05:21:00

通过对实验中的模拟数据进行筛选，并对观察数据中的随机数进行筛选，可以将实验中ABC输出的差异归因于σ的变化值。图6比较了ABC-AR和ABC Reg在σ不同值上的后均值。结果表明，即使在相对较小的样本量下，模型误判也会导致两种ABC方法之间的显著差异。我们从图6中得出了两个具体结论：一，ABC-AR的后验平均值在不同的误判水平上保持相对稳定，但随着模型误判水平的增加，它确实偏离了真实值（θ=1）；第二，即使在相对较小的误判水平下，ABC Reg的概率均值也变得不稳定。局部线性回归调整的性能尤其令人感兴趣，因为当模型被正确指定时，这种方法比BC AR（即算法1）具有理论上的优势（Li和Fearnhead，2018b）。我们在第二节和第三节中正式探讨了这些问题，但请注意，当σ≈ 1（即，正确的模型规格）bot h ABC方法给出了类似的结果。0.5 1 1.5 2.5 3 3.5 4 4.5 50.40.60.81.21.4σn=100，n=25000，真值：θ=1ABC-AR ABC Reg图1：ABC-AR和ABC-R eg的后验平均值比较，用^θ表示，跨越不同的模型误判水平。在本文的其余部分，我们阐述了上述问题，并严格描述了当生成伪数据的模型被错误指定时，接受/拒绝ABC和局部回归调整ABC的合意行为。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-6-1 05:21:03

在第二节中，我们讨论了ABC背景下的模型误判，并证明在模型误判下，对于公差的特定选择，与算法1相关的后验值逐渐集中在适当定义的伪真值上。此外，我们还证明，在模型误判情况下，ABC后验的渐近形状是非标准的，并且可以产生具有任意覆盖水平的可信集合。在第三节中，我们对图6中观察到的行为进行了严格的论证：我们证明，在模型误判下，从这些实验中获得的ABC-AR和ABC-Reg的后验密度也显示出类似的行为模式，并在附录中给出。尽管z的DGP是误判的，但由于模型误判的性质和η（y）的限制行为，如果只使用第一次汇总统计（样本平均数）模型误判，在本例中影响不大。然而，一般来说，模型误判的性质和η（y）a的精确极限形式都是未知的。因此，在ABC的实际应用中，如果不是不可能的话，那么选择一组能够减轻模型误判影响的总结将是困难的。对于局部线性（和非线性）回归调整，与接受/拒绝ABC（算法1）相比，ABC可以渐进地集中在完全不同的参数空间区域。然后，我们利用这些理论结果设计出一种替代性回归调整方法，该方法在模型规格方面表现良好。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-6-1 05:21:06

基于我们的渐近结果，第四章，我们开发了两种模型误判检测程序：基于比较算法1的接受概率的图形检测方法和基于比较算法1及其线性回归调整对应物的输出的方法。第五节最后简要概述和讨论了我们的结果。补充附录中包含了所有理论结果的证明。2 ABC中的模型错误定义在严格描述ABC在模型错误定义下的行为之前，我们首先设置了本文其余部分使用的符号。对于表示观测数据的y，welet pn表示生成y的真实分布。ABC中用于模拟伪数据的隐含分布类用P表示：={θ∈ Θ Rkθ：Pnθ}，而z表示伪数据，支持z根据Pnθ生成。模拟汇总统计η（z）=（η（z）。。。，ηkη（z））是一个kη维r andom向量，支持度为B：={η（z）：z∈ Z} Rkη。我们让d（·，·）表示Θ上的度量，d（·，·）表示B上的度量。然而，当不会产生混淆时，我们只需用d（·，·）表示通用度量。π（θ）表示先验测度，π（θ）表示其对应的密度。为了节省记法，在下面的内容中，我们忽略了Pn和Pnθ对n的依赖性，并将这些量分别表示为Pand Pθ。2.1关于ABCRecall中模型误判的概念，在基于可能性的推理中，模型误判是指P/∈ P、该模型误判的结果是Kullback-Leibler散度D（P | | Pθ）=-兹洛格dPθ（y）dP（y）dP（y），满足θ∈ΘD（P | Pθ）>0。在这种情况下，参数值θ*= arg infθ∈ΘD（P | | Pθ）被称为伪真值。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

可人4

2022-6-1 05:21:09

即使该模型是错误的，在合理的规则性条件下，贝叶斯程序预测Pθ产生后验概率的可能性集中在θ上*; 例如，参见Kleijn和van der Vaart（2012）和Muller（2013）。在本文中，我们假设当观测样本y根据P生成时，研究者通过ABC对θ进行后验推断，并且在P/∈ P、然而，与基于可能性的程序不同，ABC不是基于完整数据y，而是基于两个单独的近似值，即汇总统计η（y）和阈值。因此，即使P/∈ P模型类P可能仍然能够生成与观察到的摘要η（y）兼容的模拟摘要η（z），或在η（y）的-邻域内。ABC的近似性质意味着，在基于可能性的设置中，模型误判的概念，即infθD（P | | Pθ）>0，不一定是与ABC算法的输出或ABC后验分布相关的模型误判的有意义的概念。回顾ABC后验测度由、f或A给出 Θ，∏[A |η（y）]=ZAPθ[d（η（y），η（z））≤ ]d∏（θ）ZΘPθ[d（η（y），η（Z））≤ ]d∏（θ），我们看到，ABC中的错误指定将由η（y）、η（z）和集合{θ的行为驱动∈ Θ：d（η（y），η（z））≤ }. 因此，为了严格计算ABC中模型误判的概念，我们必须研究ABC似然Pθ[d（η（y），η（z））的极限行为≤ ]随着数据中信息量的积累。为此，我们遵循Marin et al.（2014）、Frazier et al.（2018）以及Li和Fearnhead（2018a，b）的框架，其中假设汇总统计集中在某个固定值上，即η（y）到b（P下）和η（z）到b（θ）（Pθ下）。在Marin et al.（2014）中，作者研究了=0的情况，而Frazier et al。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

kedemingshi

2022-6-1 05:21:12

（2018）和Li和Fearnhead（20 18a，b）研究>0，但允许随n变化，并设置=n。在最近的论文中，作者证明了ABC获得的关于给定θ的信息量取决于：（1）观察到的（分别模拟）总结收敛到明确极限对应物b（分别为b（θ））；（2）公差变为零的速率；（3）带b（θ）之间的联系。何时∈ P、存在一些θ，使得b（θ）=带Fr azier等人（2018）的结果完全描述了ABC后验分布的渐近行为。此外，即使P/∈ P、只要存在θ∈ Θ使得b=b（θ）。因此，ABC中模型错误定义的有意义的概念是不存在任何θ∈ Θ满足b=b（θ），这正是Marin et al.（2014）定义的模型不相容性。在剩下的时间里，我们说，如果*= infθ∈Θd（b，b（θ））>0（1），注意，当kθ<kη时，这种情况更可能发生。启发性地说，ABC中的误判意味着，在η（z）到b（θ）和η（y）到b的浓度下，通过三角不等式a和定义*d（η（y），η（z））≥ d（b，b（θ））- oPθ（1）- oP（1）≥ *- op（1），对于所有的n=o（1），事件{θ∈ Θ：d（η（y），η（z））≤ n}变得极为罕见，对应于事件{θ∈ Θ：d（η（z），b（θ））>*- o（1）}。因此，对于公差序列n=o（1），一次n<*+ o（1）无论我们从π（θ）生成多少模拟样本，几乎不会选择θ的任何绘图，并且随着n的增加，ABCposterior∏[A |η（y）]将变得不正常。虽然公差序列n=o（1）最终会导致后∏[A |η（y）]表现不良，但其他选择可能会产生表现良好的后∏。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

nandehutu2022

2022-6-1 05:21:15

在下一节中，我们展示了满足n的（某些）容差序列→ *, 作为n→ +∞,产生表现良好的ABC后验概率，将后验质量集中在适当定义的伪真值上。2.2错误分类下的ABC后验浓度基于上一节的直觉，在本节和下一节中，我们严格描述了∏[A |η（y）]=ZAPθ[d（η（y），η（z））的渐近行为≤ n]d∏（θ）ZΘPθ[d（η（y），η（Z））≤ n]d∏（θ）当P/∈ P和*> 为此，我们首先定义以下附加符号：对于序列{an}和{bn}，实值，an。BN表示≤ CBC对于某些C>0，an bn表示等效震级，an>>bn表示更大的数量级，符号oP（an）、oP（bn）具有其通常的含义。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-6-1 05:21:18

除非另有说明，否则所有限值均取n→ +∞.我们维持以下假设。[A0]存在一个唯一的b，即d（η（y），b）=oP（1）和一个正序v0，n→ +∞这样的信息→+∞Pd（η（y），b）≥ v-10，n= 存在一个连续的内射映射b:→ B Rkη和满足ρn（u）的函数ρn（·）→ 0作为n→ +∞ 对于所有u>0，且ρn（u）在u中单调不增加（对于任何给定的n），例如，对于所有θ∈ Θ，Pθ[d（η（z），b（θ））>u]≤ c（θ）ρn（u），ZΘc（θ）d∏（θ）<+∞,其中z~ Pθ，我们假设以下任一情况：（i）序列发展：存在一个正序列vn→ +∞ u，κ>0，使得ρn（u）=v-κnu-κ、对于u≤ u、（ii）指数偏差：存在hθ（·）>0，使得Pθ[d（η（z），b（θ））>u]≤ c（θ）e-hθ（uvn），存在m，C>0，使得zΘC（θ）e-hθ（uvn）d∏（θ）≤ Ce公司-m·（uvn）τ，对于u≤ u、存在一些D>0和M，δ>0，因此，对于所有δ≥ δ>0和M≥ M、存在Sδ {θ ∈ Θ：d（b（θ），b）- *≤ δ} 其中（i）在[A1]的（i）情况下，D<κandRSδ1.-c（θ）Md∏（θ）&δd.（ii）在[A1]的情况下，RSδ1.- c（θ）e-hθ（M）d∏（θ）和δd。上述假设与Frazier et al.（2018）中给出的假设相似，我们请读者参考该文件中的备注1和2以及示例1，以详细讨论这些假设。在上述假设下，我们得出以下结果。定理1。假设y满足度[A0]的数据生成过程和方程式（1）所适用的数量。还假设满足条件[A1]和条件[A2]↓ *带n≥ *+ 中压-1n+v-10，n，对于足够大的M。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-6-1 05:21:21

设mn为任意正序，取in fi和δn≥ Mn（n-*), 然后∏[d（b（θ），b）≥ *+ δn |η（y）]=oP（1），（2）只要δn≥ Mnv公司-1nu-D/κn=o（1），在（i）假设[A1]δn的情况下≥ Mnv公司-1n | log（un）| 1/τ=o（1），如果（ii）是假设[A1]。un=n时-(*+ 中压-1n+v-10，n）≥ 我们提醒读者，所有理论结果的证明都包含在附录中。备注1。定理1指出，即使模型规格错误，ABC po steriorConcentrate仍然集中在参数infθ上∈Θd（b（θ），b），假设略大于*. 在Orem 2的更精确框架下，研究后验分布的渐近形状，可以将该条件重新定义为允许略小于*. 然而，我们证明如果*-在正常数下有界，则后验分布不一定是集中度e。使用定理1中的后验集中度，我们得到以下结果。推论1。假设满足定理1的假设并定义θ*∈ Θasθ*= arg infθ∈Θd（b，b（θ）），然后，对于任何δ>0，则∏[d（θ，θ*) > δ|η（y）]=oP（1）。备注2。定理1和推论1证明，在识别条件下，ABC后∏∏[·|η（y）]集中在θ上*因此，Theorem1是Frazier et al.（2018）中定理1对错误模型的扩展。此外，我们注意到上面的定理1类似于定理4。3 Bernton等人（2019年）基于Wasserstein距离的forABC推断。每个结果的有效性都要求mapθ7→ b（θ）是内射的。如果不满足该条件，则可能存在一个连续的值，在该值下d（b（θ），b）=*. 在这种情况下，ABC后验将不再收敛于点质量，而是集中于集合{θ∈ Θ : *= d（b（θ），b）}。备注3。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-6-1 05:21:24

重要的是要注意伪真值θ*取决于d（·，·）的选择。这意味着基于两个不同度量d（·，·）和▄d（·，·）的ABC将产生两个不同的伪真值，除非通过偶然事件影响{θ∈ Θ：d（b（θ），b）}和inf{θ∈ Θ：~d（b（θ），b）}重合。这与Frazier et al.（20 18）中的后验浓度结果形成鲜明对比，后者表明，在正确的模型规格下，后验∏[·|η（y）]浓度在相同的真值上，无论选择d（·，·）。2.3渐近后验分布的形状在本节中，我们分析了模型误判下ABC后验分布的渐近形状。为简单起见，我们将模拟和观察总结收敛到极限对应项的速率取为相同，即取v0，n=vn，并将其视为距离（η（z），η（y））=kη（z）-η（y）k，其中k·k表示与给定标量乘积h·，·i相关的范数。用Ikη表示（kη×kη）维单位矩阵，并设Φ（B）=PrN（0，Ikη）∈ B,对于Rkη的任何可测子集B。需要以下条件来确定本节的结果。[A0′]假设[A0]满足，且*= d（b（θ*), b） >0，其中θ*= arg infθ∈Θd（b（θ），b）。[A1′]假设[A1]成立，对于某些正定义矩阵∑n（θ*), c> 0，κ>1，δ>0，对于所有kθ- θ*k≤ δ、 Pθ[k∑n（θ*){η（z）- b（θ）}k>u]≤ 铜-k表示所有0<u≤ δvn。【A3】地图θ7→ b（θ）在θ处连续可微两次*还有雅可比θb（θ*)具有全列秩kθ。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-6-1 05:21:26

kb的Hessian（θ）- bk在θ处评估*, 并用H表示*, 是正定矩阵。【A4】存在一系列（kη×kη）正定义矩阵∑n（θ），因此对于所有M>0的矩阵，存在u>0，其上为| x|≤Msupkθ-θ*k≤u | Pθ（hZn，ei≤ x）- Φ（x）|=o（1），其中Zn=∑n（θ）（η（z）- b（θ））和e=（b（θ*) - b） /千字节（θ*) - bk.【A5】存在Vn趋于完整且u>0，因此对于所有kθ- θ*k≤ u、函数θ7的序列→ ∑n（θ）v-1N收敛于某个正定义矩阵A（θ），并在θ处等连续*.【A6】π（θ），先验测度∏（θ）的密度，在θ处连续且为正*.允许v0、nand和vnto差异不会极大地改变以下结果。给出的结果仍然有效，但仅适用于两种速率中较慢的速率。[A7]对于Zn=∑n（θ*){η（y）- b} 所有MN都将进入单元kZnk>Mn= o（1）。上述假设与Fr azier等人（2018年）在正确模型规格下推导ABC订单限制形状时使用的假设相似，我们将感兴趣的读者参考论文中的备注3和备注4，以详细讨论这些假设。在a boveassumptions下，我们得到以下结果。定理2。假设[A0′，[A1′]（带κ）≥ kθ、[A2]和[A3]-[A7]是令人满意的。我们得到了以下结果。（i）如果limnvn（n-*) = 2c，带c∈ R、然后，对于k·kT V，总变化标准k∏v1/2n，-QckT V=oP（1），其中∏zn，是zn（θ）的ABC后验分布- θ*) 对于任何序列zn>0且Qchas密度qc相对于Rkθ上的Lebesgue测量与qc（x）成比例∝ Φc-hZn，A（θ*)ei*kA（θ*)ek*-x个H*x4kA（θ*)ek*（ii）如果limnvn（n- *) = +∞ un=n时- *= o（1），对于U{kxk≤M} 集合{kxk上的一致测度≤ M} ，k∏u-1n，-U{xH*x个≤2} kT V=oP（1），备注4。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

kedemingshi

2022-6-1 05:21:29

在模型规格正确的情况下，如果太大，这意味着（n- *) >> 1/vn，则ABC-po-sterioris的渐近分布是均匀的，半径为n阶- *. 与正确型号规格的情况相反，如果*> 0和if vn{n- *} → 2c∈ R、那么极限分布就不再是erGaussian分布了。此外，即使c=0，该结果仍保持不变。备注5。在基于似然的贝叶斯推理中，如果模型被误判，可信集通常不是有效的密度集，但是，得到的后验值仍然是渐近正态的（参见Kleijn和van der Vaart，2012和Muller，2013）。在ABC的情况下，不仅可信集不是有效的置信集，而且ABC后验的渐近形状也不是aussian的。备注6。在实践中*未知，因此无法直接选择。然而，我们注意到，ABC的应用通常是通过在一些预先规定的（且逐渐缩小的）分位数阈值内接受θ的绘制来实现的；i、 e.一个接受模拟图θiif d（η（zi），η（y））小于模拟值d（η（zj），η（y）），j的α-次经验分位数≤ N、然而，正如Frazier et a l.，2018年所讨论的，ABC方法的两个代表是双重的，即选择δv阶上的α值-kθn，δ小，对应于选择|n- *| . δ1/kηvn和选择αn和Mv-kθn与选择n相关- *& Mvn。我们进一步阐述了第4.1节中两种方法之间的等效性。有趣的是，定理2（附录中提供）的证明证明了如果vn（n-*) → -∞, 尤其是当n=o（1）和*> 0，无需出现∏[·|η（y）]的后验浓度。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-6-1 05:21:32

我们在下面的简单示例中演示了这种现象。示例2：考虑kθ=1和kη=2的情况。让▄Zy=√n（η（y）- b）和锌=√n（η（z）-b（θ）），其中▄Zn~ N（0，vθI），对于vθ，θ的一些已知函数，b（θ）=（θ，θ）.此外，假设b=（(R)b，-“”b），其中“”b6=0。在此设置下，当k·k是欧氏范数时，唯一的伪真值为θ*= 然而，根据vθ，近似后验值不必集中在θ上*= 0、以下命题对此进行了总结。提案1。在上面的设置描述中，如果vθ/vθ*= σ（θ），f或vθ*一些已知函数，例如σ是连续的和σ（(R)b/2）≥ 3，如果先验密度为正且连续[-\'b，\'b]，然后∏{|θ- θ*| ≤ δ|η（y）}=oΠ|θ-\'b/2 |≤ δ|η（y）= o（1）。3不规范情况下的局部回归调整3.1后验集中局部回归对ABC的调整发现了对从业者的广泛适用性。然而，当人们愿意接受模型错误定义的想法时，我们警告不要盲目应用局部回归调整。如介绍性示例所示，使用这种特殊的调整可能会导致点估计量的行为与从m算法1获得的结果非常不同，即使在小样本中也是如此。在本节中，我们首先严格描述了模型误判下局部线性回归调整ABC（ABC Reg）的后验浓度。利用这个初始结果，我们将结论推广到局部非线性回归调整方法。为了简单起见，我们只考虑标量θ的情况，然而，我们允许η（y）是多维的。ABC Reg首先使用公差n运行算法1，以获得一组可接受的绘图和摘要{θi，η（zi）}，然后使用线性回归模型调整θ的可接受值。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-6-1 05:21:35

这样，通过线性回归模型θi=u+β，原始接受值θi与η（y）和η（z）部分相关{η（y）- η（zi）}+νi，其中νide表示模型残差。定义θ=PNi=1θi/N和η=PNi=1η（zi）/N。给定θi，ABC Reg然后根据θi=θi生成调整后的参数图-^β{η（zi）- η（y）}，β=“NNXi=1η（zi）- ηη（zi）- η#-1“NNXi=1η（zi）- ηθi-θ#=dVar-1（η（zi））dCov（η（zi），θi）这个结果可以以更复杂的参数为代价进行扩展，但我们避免使用这种设置，以简化对结果的解释。因此，对于θi~ πθ的后验测度∏θ只不过是∏θ[·|η（y）]的缩放和移位版本。因此，ABC Reg后验值的渐近行为由∏[·|η（y）]、β和{η（y）的行为决定- η（zi）}。下面的结果描述了ABC Reg后验概率∏[·|η（y）]的渐近行为。推论2。假设[A0′、[A1]和[A2]满足且↓ *带n≥ *+ 中压-1n+v-10，n，足够大。此外，假设对于kβk>0的so meβ，k^β- βk=oPθ（1）。定义￠θ*= θ*- β（b（θ*) - b）。设mn为任意正序列，取in-finity和δn≥Mn（n-*), thene∏[|θ-~θ*| > δ|η（y）]=oP（1），只要δn≥ 中压-1nu-D/κn=o（1），当（i）为消耗δn时≥ 中压-1n | log（un）| 1/τ=o（1），假设（ii）【A1】。un=n时-(*+ 中压-1n+v-10，n）≥ 0、备注7。推论1和推论2的直接结果是，ABC后∏∏[·|η（y）]的质量集中在θ上*= arg infθ∈Θd（b（θ），b），而ABC Reg posteriore∏[·|η（y）]将质量集中在θ上*= θ*- β（b（θ*) -b）。因此，ABC Reg采用θ的绘图，该绘图在最小化观测和模拟摘要之间的所选距离d（·，·）方面（渐近）最优，并以（线性）方式对其进行扰动，无需保持原始绘图的最优性。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-6-1 05:21:38

此外，forkβk大，伪真值|θ*, ABC Reg集中在其上，可以很容易地躺在Θ之外。因此，如果模型规格错误，则无法保证ABC Reg返回的图纸在最小化d（·，·）方面是最优的，甚至无法保证ABC Reg返回的值为。备注8。重要的是，推论2的结果和备注7中讨论的现象不限于局部线性回归调整，而是扩展到回归调整的非线性变化。为简洁起见，我们在此仅勾勒出总体思路，并注意到严格的证明遵循与推论2相同的路线，因此省略。对于一些未知函数m（·），考虑非线性回归模型θ=m（η（z））+v。用^m（·）表示未知回归函数的非参数估计量，该函数是使用公认的图{θ}构造的l, η（zl)}l≤从附录endix中获得，我们在g和k分布的c定义中给出了这一后期行为的具体示例。ABC后∏[·|η（y）]。一种非线性回归后处理方法转换接受的θl进入￠θl= θl+^m（η（y））- ^m（η（zl)), 对于l = 1.五十、（3）在正则条件[A0′、[A1]和[A2]下，如果（非参数）估计量^m（·）收敛到函数m*（·），^m（η）=m*（η） +op（1），在bandb（θ）的邻域内一致*), 然后通过η（y）和η（z）的浓度l), 方程式（3）变为|θl= θl+ {m*（b）- m级*（b（θ*))}+ op（1）=θ*+ {m*（b）- m级*（b（θ*))}+ op（1）。最后一个等式是∏[·|η（y）]向θ的后向浓度*, i、 e.，θl=θ*+ op（1）。因此，只要m*（b）- m级*（b（θ*)) 6=0无非线性回归后处理ABC后集中在一个不同于∏[·|η（y）]的值上，这不影响校正。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

nandehutu2022

2022-6-1 05:21:41

此外，鉴于^m（·）是使用模拟数据构建的，没有理由怀疑m*（b） =米*（b（θ*)). 最后，我们注意到，如果我们考虑了一个非线性条件异方差回归模型，如Blum和Fran,cois（2010），则上述计算不会发生显著变化。因此，非线性条件异方差回归调整将具有与非线性回归调整类似的渐近行为。备注9。推论1和2的另一个结果是，ABC后验∏[·|η（y）]和ABC Reg后验∏[·|η（y）]将产生不同的后验期望。根据∏[·|η（y）]和∏[·|η（y）]计算的期望值之间的差异解释了图6中观察到的ABC-AR和ABC Reg后验均值之间的差异。在下一节中，我们使用此行为推导出一个检测模型错误的过程。3.2调整局部回归调整模型规格错误情况下接受/拒绝ABC和ABC Reg之间的差异与回归调整有关，即重新调整接受图纸的中心θiby^β{η（y）- η（z）}。在正确的模型规格下很有用，当模型规格错误时，调整可以迫使θ偏离θ*并朝向|θ*, 它不需要位于Θ或在最小化D（·，·）方面是最优的。这种行为的原因是η（z）无法复制η（y）的渐近行为，这在Marin et al.（2014）的术语中意味着模型与观察到的总结不兼容。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

可人4

2022-6-1 05:21:43

汇总统计数据的这种不相容性确保了集中术语^β的影响{η（y）- η（z）}可以很容易地支配已被接受的绘图θi，而介绍性示例只是这种行为的一个示例。为了保持局部线性回归调整在ABC中的广泛适用性，并确保其在模型误判情况下给出合理的结果，我们建议对回归调整方法进行有用的修改。为了激发这种修改，回顾一下，在正确的模型规格和规则性条件下，一阶线性回归调整方法确保（见Frazier et al.，2018中的定理4）：~θi=θi+β{η（y）- η（z）}=θi+^β{b- b（θi）}+Op（1/vn）=θi-θb（θ*)五、-1.θb（θ*)-1.θb（θ*)五、-1.θb（°θ）（θi- θ*) + Op（1/vn），（4），其中b=b（θ*) 根据正确的模型规格，’θ是满足‘’θ的中间值- θ*| ≤|θi- θ*|, V=limnVar[√n{η（y）- b} ，第三行来自均值展开和局部线性回归调整的定义。因此，从（4）可以看出，即使kη>kθ，η（y）的维数也不会影响ABC正则后验均值的渐近方差。这一结果（至少在第t部分）有助于解释（从技术角度）ABC Reg方法作为降维方法的普遍性。然而，在模型规格错误的情况下，对于任何θ，b6=b（θ）∈ 因此不存在中间值θ- b（θi）6=θb（°θ）（θ*-θi）。因此，如果模型不准确，等式（4）通常无效。ABC Reg在正确和不正确模型规范下的行为表明，用替代项替换η（y）可以缓解后者下的不良行为。为此，确定^θ=Rθd∏[θ|η（y）]为接受/拒绝ABC的后验平均值。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

nandehutu2022

2022-6-1 05:21:46

设^zm，m=1。。。，M、是在假定DGP下模拟的一组长度n的伪数据，值为^θ，定义^η=MXm=1η（^zm）/M。使用^η，我们可以执行修改后的局部线性回归调整θi=θi+^β{^η -η（zi）}。这种改进方法的关键在于，在正确规格下，η的行为类似于η（y），而在错误规格下，η的行为类似于η（z）。这种构造的一个直接后果是，这种方法避免了模型错误指定下产生的不兼容性问题。此外，由于这种新的回归调整方法使用了从接受/拒绝ABC后验平均值^θ计算的中心序列，因此这种新方法的渐近行为类似于接受/拒绝ABC。示例1（续）：回想假设的DGP为z，zniid为N（θ，1），但实际DGP为y，yniid为N（θ，σ）。ABC使用以下汇总统计数据进行：o样本平均值η（y）=nPni=1yi，o样本方差η（y）=n-1Pni=1（yi-η（y））。虽然M的选择不会渐近重要，但我们认为应选择M，以使^η相对于η（z）的变化率较小。我们考虑三种不同的DGP，对应于σ∈ {1 , 2, 3}. 对于每种情况，我们为长度为n=100的y生成1000个ar官方样本，并应用四种不同的ABC方法：接受/拒绝ABC方法（ABC-ar）、博蒙特等人（2002）的局部线性回归调整（ABC Reg）、我们新的局部线性回归调整（ABC Reg），以及Blum和Fran,cois（2010）使用神经网络（ABC-NN）进行的非线性回归调整。每个过程依赖于根据zji生成的N=25000个伪数据集~ N（θj，1），其中优先级由θ给出~ N（0，25）。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-6-1 05:21:49

对于每个程序，我们将公差设置为模拟距离kη（y）的1%分位数- η（zi）k。图2绘制了蒙特卡罗重复和所有设计中每种方法的后验平均值。结果表明，新的回归调整在正确和不正确的模型规范中都保持了稳定的性能，而从ABC Reg和ABC-NN获得的点估计值变化更大。更具体地说，对于σ∈ {1，2}我们看到，所有回归调整往往会给出类似的结果。然而，对于σ=3，很明显，与其他ABC方法相比，传统的线性和非线性调整方法在重复样本中产生的点估计具有更大的可变性。这种额外的可变性是ABC Reg和ABC-NN在可接受的绘图θi和η（y）之间实施回归关系这一事实的直接结果- η（z），当一个不一定存在时。正如我们在推论y 2中所看到的，强制使用这个额外的（错误的）模型来产生θi的新值，它不需要考虑θi和η（y）之间的实际关系-η（z），将（随机）使调整后的牵引物偏离其初始后质量中心θ*, 并且可以在重复采样环境中产生更具可变性的点估计量。AR RegN Reg NN0.8 0.9 1.0 1.1 1.2 1.3σ2=1AR RegN Reg NN0.6 0.8 1.0 1.2 1.4σ2=2AR RegN Reg NN0.0 0 0.5 1.0 1.5 2.0σ2=3图2:ABC-AR（AR）、标准局部线性回归调整（Reg）、新回归调整方法（RegN）和跨σ的局部非线性回归调整（NN）的后验平均值比较∈ {1, 2, 3}.

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-6-1 05:21:52

回想一下，σ=1对应于正确的模型规格。除了后验平均数的结果外，我们在表1中记录了每种方法的后验标准差、相应95%可信集的长度以及不同设计的蒙特卡罗覆盖率。表1中给出的值表示蒙特卡罗复制中这些数量的平均值。结果表明，所有局部回归调整，ABC Reg、ABC RegN和ABC-NN，都比ABCAR（平均值）具有更小的空间变异性和更短的可信集。因此，当模型被误判时，这种行为会给研究人员带来错误的精度感，并导致所有局部回归调整程序（线性和非线性）的覆盖率（伪真值）很低。因此，尽管我们的新回归调整程序在正确和不正确的模型规格下都能提供稳定的性能，但它仍能解决理论2之后的备注中提到的覆盖率问题。此外，补充附录中进行的其他数值实验表明，如Blum和Fran,cois（2010）中所述，对局部回归调整使用所谓的异方差校正并不显著改变这些结果。更具体地说，由此产生的经异方差校正的局部回归调整方法产生的结果与未经异方差校正的结果非常相似。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-6-1 05:21:56

有关这些详细信息，请参阅附录中感兴趣的读者。从这个简单的例子中，我们可以得出结论，在模型误判下，线性和非线性的局部回归调整方法，无论有无异方差校正，都可能导致对从这些方法获得的结果点估计的严重过度信任，并可能导致伪真值的覆盖率较低。表1：在不同模型误判水平下，简单正态样本的蒙特卡罗覆盖率（Cov）、可信集长度（Len）和后验标准差（Std）。Cov是95%可信集包含θ=1的时间百分比。Len是蒙特卡罗试验中信用集合的平均长度。Std是蒙特卡罗试验的平均后验标准差。ABC-AR ABC RegNCov Len Std Cov Len Stdσ=1 0.9820 0.4666 0.1221 0.9380 0.3851 0.1001σ=2 0.9610 0.6147 0.1576 0.8020 0.3837 0.0998σ=3 0.9130 0.6164 0.1581 0.7070 0.3839 0.0997ABC-Reg ABC NNCov Len Std Cov Len Std Cov Len Stdσ=1 0.9410 0.3820 0.0997 0.9500 0.3853 0.1006σ=2 0.7170 0.3826 0.0998 0.7290 0.4440 0.1228σ=3 0.4600 0.3821 0.0997 0.4190 0.5043 0.14904检测Mi规范在本节中，我们提出了两种方法来检测ABC中的模型错误规范。第一种方法基于正确和不正确模型规范下的接受概率行为。第二种方法基于比较∏[·|η（y）]（从算法1获得）和∏[·|η（y）]（使用局部线性回归调整获得）下计算的后验期望。4.1从Frazier等人的结果中，用一种简单的图形方法来检测误判。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-6-1 05:21:59

（2018），在规则和正确模型规范下，验收概率αn=Pr[d（η（y），η（z））≤ n]saties，对于n大和>> v-1n，αn=Pr[d（η（y），η（z））≤ n] kθn.这样，asn→ 0验收概率αn→ 0以kθn近似线性的方式表示。然而，α与θn之间的这种关系不适用于模型特殊的情况。特别是，如果*> 0，一次n<n*即使是大量模拟，验收概率αN也将很小或为零。在正确和不正确的模型规格下，α的行为意味着可以通过比较αN的行为和公差值的递减序列来诊断错误规格。特别是，如果我们采用等距公差的递减序列1，n<2，n<····<J，则nwe可以构造并绘制生成的序列{αJ，n}jt，以确定{αJ，n}jd是否以（近似）线性方式递减为J，n}。虽然αnis在实践中不可能获得，但同样的程序也可以应用于αnre，由估计量^αn=PNi=11l[d（η（y），η（z））≤n]/n.这样，可以使用ABC参考表轻松执行此类图形检查。唯一的区别是，不是考虑单个公差，而是考虑一系列公差{j，n}jand记录，对于每个j，αj，n=NXi=11l[d（η（y），η（z））≤j，n]/n。一旦获得^αj，nHa，就可以绘制它与kθj，n的关系图（以某种方式），并可以分析关系，以确定是否存在明显的线性偏差。为了准确理解如何实现这样的过程，我们返回simplenormal示例。示例1（续）：假设D GP为z，zniid为N（θ，1），但实际DGPis y，yniid为N（θ，σ）。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-6-1 05:22:02

我们再次使用以下汇总统计数据考虑ABC：o样本平均值η（y）=nPni=1yi，o样本方差η（y）=n-1Pni=1（yi-η（y））。Ta kingσ∈ {1，1+1/9，…，1+8/9}，我们根据Yi生成大小为n=100的观察样本~ N（1，σ），iid，其中，对于九个不同的模拟数据集，我们保持随机数固定，只改变σ。我们考虑N=25000个根据zji生成的模拟数据集~ N（θj，1），带θj~ N（0，25），对于d（·，·），我们取欧几里德范数。对于j，n值序列，我们考虑j=100个等距增量，其中j，n与模拟距离的10%分位数相对应，其中1，n取模拟距离的0.1%分位数。在图3中，我们绘制了九个不同级别的误判结果。每幅图都包含两条不同的曲线：虚线表示观察到的αj、nand、n之间的关系，而实线绘制了αj、nand、n之间的线性关系，可用于直观地诊断偏离线性的情况。0.00 0.02 0.04 0.06 0.08 0.1 00.0 0.3 0.6^αnn0.00 0.02 0.04 0.06 0.08 0.1 00.0 0 0.3 0.6^αnn0.00 0.02 0.04 0.06 0.08 0.1 00.0.3 0.6^αnn0.00 0.02 0.04 0.08 0.1 00.1 0.4 0.7^αnn0.00 0.02 0.04 0.06 0.08 0.1 00.2 0.6^αnn0.00 0.02 0.04 0.06 0.08 0.1 00.3 0.6 0.9^αnn0.00 0.02 0.04 0.06 0.08 0.1 00.4 0.7 1.0^αnn0.00 0.02 0.04 0.06 0.08 0.1 00.6 0.9 1.2αnn0.00 0.00 02年0.04 0.06 0.08 0.1 00.7 1.0 1.3^αn配置图3：公差值j，n递减序列的经验验收概率^αj，n（虚线）和理论验收概率（实线）的图形比较。我们记得，在本例中，校正规范在^α和n之间存在线性关系，因为我们只对一个参数进行推断。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-6-1 05:22:05

更一般而言，在模型规格不正确的情况下，我们预计^α与kθn之间存在线性关系。分析图3，我们发现σ的关系相当线性≤ 1 + 1/3. 然而，当σ>1+1/3时，接受概率αj，与αj，之间的关系会导致显著的非线性行为。因此，在本例中，诊断者会建议，一旦σ>1+1/3，模型就被指定，这可以通过αn、jandj、n之间的非线性关系来证明。显然，从这种图形方法中获得关于模型错误指定的广泛结论取决于基础模型的许多特征、θ的维数和错误指定的精确性质。然而，始终可以将观测数据的结果与根据ABC参考表获得的结果进行对比。也就是说，使用ABCreference表，我们可以很容易地将上述诊断应用于一个或几个“观察到的”Sea。通过σ的不同值，使用端点对（αJ，n，J，n）=（0.10，J，n）和（αJ，n，J，n）=（0.001，1，n）构建实线。参考表中的ries。然后，如果观察数据中（αj，n，j，n）之间的关系与参考表中观察到的关系不同，则表明该模型有误。4.2使用回归A调整检测模型错误推论1和2证明接受/拒绝ABC（ABC-AR）和局部线性回归调整ABC（ABC Reg），将后质量放置在参数空间的不同区域。因此，对于θ7→ h（θ）一个已知的光滑函数，在模型错误指定下，h（·）在ABC-AR和ABC Reg下的后验预测，^h=Zh（θ）d∏[θ|η（y）]，^h=Zh（θ）de∏[θ|η（y）]，将在概率上收敛，如n→ +∞ 和n↓ *, 以区分不同的值。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝