响应面排序的序贯设计

2022-5-9 03:56:20

排序反应面的序贯设计Hu和Mike Ludkovski*摘要受随机控制应用中最优反馈策略映射估计问题的启发，我们提出并分析了排序多个响应面的顺序设计方法。也就是说，吉文尔≥ 2连续输入空间X上的响应面，目的是高效地找到整个X上最小响应的指数。响应面未知，必须一次一个地进行噪声采样，需要在空间和响应指数维度上进行联合实验设计。为了生成序贯设计启发法，我们研究了贝叶斯逐步减少不确定性的方法，以及基于后验分类复杂性的抽样。我们还将我们的连续输入公式与多武装匪徒中纯粹后悔的离散框架联系起来。为了对响应面建模，我们使用克里格元模型。文中给出了几个使用合成数据和流行病控制问题的数值例子，以说明我们的方法和相应自适应设计的有效性。关键词。序贯设计、响应面建模、随机克里格法、序贯不确定性减少、预期改进1。介绍随机控制问题的一个核心步骤是估计用于逼近最优反馈控制的预期成本。在这个问题的模拟方法中，通过生成随机系统的轨迹来抽样成本，然后根据当前系统状态进行回归。最终对产生的Q值进行排序，以找到将预期成本降至最低的行动。当模拟成本很高时，计算效率和实验设计就变得很重要。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-9 03:56:23

顺序策略将学习成本重新表述为另一个动态计划，其行动与抽样决策相对应。在这篇文章中，我们探讨了这个顺序设计问题的贝叶斯公式。排名目标采用了一种新的损失函数，它混合了分类和回归标准。此外，由于存在多个随机采样器（每个可能的动作一个采样器）和一个连续的输入空间，有必要开发有针对性的响应面方法。特别是，一项重大创新是并行建模每个Q值内的空间相关性，同时利用多臂bandit透视图选择下一个要调用的采样器。为了获得Q值的可处理近似值，我们提倡使用高斯过程元模型，将潜在响应面视为高斯随机场的实现。因此，排名标准是根据eachQ值的后验不确定性制定的。因此，我们将元模型的不确定性与抽样决策联系起来，类似于排序和选择的离散框架以及多武装强盗。我们的工作在随机模拟器的仿真和随机控制之间建立了新的联系，提供了一类新的近似动态规划算法。1.1. 抽象排序问题。让u`:X→ R、 `∈ L≡ {1，2，…，L}be L光滑函数在Rd的子集X上。我们对学习加州大学圣巴巴拉分校统计与应用概率系93106的最终排名问题感兴趣-3110hu@pstat.ucsb.edu,ludkovski@pstat.ucsb.edu.NSF ATD-1222262.2 Ruimeng Hu和Michael Ludkovski在输入空间X上部分支持的工作，即查找分类器（1.1）C（X）：=arg min`{u`（X）}∈ L.函数u`是先验未知的，但可以进行噪声采样。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

nandehutu2022

2022-5-9 03:56:27

这适用于任何x∈ 十、 `∈ Lwe可以访问模拟器Y`（x），该模拟器生成u`（x）的估计值：（1.2）Y`（x）=u`（x）+`（x），`∈ 我在这里`是方差为σ`（x）的独立平均零随机变量。直观地说，我们在X上有L个光滑的超曲面，可以通过蒙特卡罗采样。在dynamicprogramming上下文中，x是系统状态，`为控制器可用的各种操作编制索引，u`（·）代表执行和执行的预期成本`（·）捕获从底层随机系统的路径模拟中产生的模拟噪声和相应的成本。我们的目标是在整个输入空间中全局确定最小曲面。更准确地说，我们试图在每个x上赋值∈ X a标签^C（X），同时优化损失度量（1.3）L（^C，C）：=ZXn^C（X）（X）- （dx）的uC（x）（x），其中F（·）是x上的一个特定权重函数，确定不同区域的相对重要性。因此，如果排名正确^C（x）=C（x），则损失为零，否则与所选响应与真实最小^C之间的（正）差异成正比- uC.上述标准旨在确定最佳行动`*（十）≡ C（x）在x国采取行动；如果选择了错误的动作^C（x），则（1.3）会捕获控制器的综合损失，假设潜在状态x的概率分布F（·）。在（1.3）中，损失函数混合了回归和分类目标。在回归中，我们试图用与单个表面u`（·）相关的损失函数来略微估计响应。相反，（1.3）只是关于正确识别最小响应的指数。因此，只要最小响应不变，就可以容忍较小的估计误差，从而导致损失函数中的阈值行为。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-9 03:56:30

在分类中，损失函数是离散的（通常带有固定的误分类惩罚），而（1.3）将损失与误分类距离C（x）（x）成比例-uC（x）（x）。另一个关键区别是，在分类中，采样空间仅为X（返回一个嘈杂的标签C（X）∈ 五十），而在我们的上下文中，采样查询由位置索引对（x，`）组成∈ X×L，一次采样一个响应。我们需要分析样本的数量，而我们需要分析样本的数量。由于u`（·）是未知的，我们将（1.3）定义为一个贝叶斯顺序学习问题，即自适应地增长一个设计Z，从而快速学习C（x）。经典的静态设计，即与响应无关的设计，不足以进行排名，因为优化计算效果的整体本质是基于对未知u′s结构的学习，学习表现为通过在输入空间X（集中在难以识别C（X）的区域）和采样指数L（集中在u′可能是最小响应的表面）中进行区分来聚焦采样。由于联合设计空间X×L，我们的问题允许双重解释。修正“，（1.1）是关于重建未知响应面x7→ u`（x）通过嘈杂的样本。排序响应面3的顺序设计将不同的响应面聚合在一起，X上的顺序设计减少到识别X=∪Li=1Ciinto集合ci:={x:C（x）=i}={x:uC（x）（x）=min`u`（x）=ui（x）}，i=1，L.（1.4）因为在分区的内部，等级C（x）更容易识别，主要问题是确定分区边界Ci。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-9 03:56:33

因此，（1.1）与轮廓查找相关，在[22,42,43]中对其进行了顺序设计研究。标准等高线查找尝试识别响应面的水平集{u（x）=a}，对应于L=2，已知u（x）=a在（1.1）中。因此，本文的分析可以被视为轮廓查找的多变量扩展。在内部，轮廓查找概括了将噪声响应最小化的经典目标，与模拟优化中的预期改进/信息增益权衡相关联。特别是，我们重新制定了[14,36]中的主动学习规则。相反，确定最小响应arg min`u`（x）的目标x对应于多武装匪徒（MAB）的设置。土匪有L个手臂和相应的报酬∈ 五十、决策理论目标（1.1）称为纯勘探问题[7,8]。对哪些arm进行拉动的决策政策通常以后验均值和对各自支付的信心来表示；这种观点促使我们使用差距上限（UCB）设计策略[4,46]。与本文献相比，（1.3）包含两个关键差异。首先，损失函数是一个加权纯后悔标准，据我们所知，它从未在MAB环境中使用过。第二，我们不是一个拥有独立武器的土匪，而是将其从根本上扩展到一个由x索引的土匪连续体∈ X.最近，[26,17]考虑了多个强盗，它们可以被视为（1.1），具有离散的、非度量的X。我们将它们的设置概括为连续的X，具有手臂的空间相关结构。1.2. 方法概述。要处理连续状态空间x∈ 对于随机控制中出现的X，我们采用克里格或高斯过程（GP）回归的框架来建模Q值。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

2022-5-9 03:56:36

在实验设计（DoE）和连续MAB两种情况下，克里格模型可能是最流行的框架[47]。特别是，克立格法已被广泛用于序列回归设计，因为它允许一种直观的方法在样本间借用信息，以建立整个响应面的全局估计。另外两个优势是高斯过程的分析结构，允许对许多预期的改进标准进行分析评估，以及在需要插值数据的确定性（无噪声）实验建模和额外需要数据平滑的随机模拟器之间自然过渡的能力。更一般地说，我们建议从贝叶斯的角度进行全局排序，将响应曲面视为在给定函数空间中取值的随机变量的实现。这提供了后验元模型不确定性的可处理量化，以及用于确定最小曲面的相关顺序度量。因此，我们强调克里格法对我们算法的实现不是必不可少的；例如，在基于树的模型中可以找到有竞争力的替代方案，如动态树[25]和贝叶斯树[12]。此外，虽然经典克里格法对于一些具有挑战性的问题可能不够灵活，但现在已经有了一些成熟的推广，包括树状GPs[24]、本地GPs[20]和基于粒子的GPs[23]，所有这些都通过公共R包提供了货架使用。根据高效的全局优化方法[29]，我们确定了预期的改进原因，将排名问题的局部复杂性与我们估计的后验方差4 Ruimeng Hu和Michael Ludkovski结合在一起。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-9 03:56:39

特别是，我们依赖后验方差的预期减少，并借鉴了[41,10]中基于GP回归的逐步不确定性减少标准。我们还研究了UCB型启发法[4]来权衡勘探和开发目标。基于上述想法，我们获得了一些完全顺序的程序，这些程序专门针对在整个设计空间X上高效学习C（·）。我们进行了大量的数值实验，以比较这些建议，并确定最有希望的解决方案。如前所述，我们的算法是由勘探开发范式驱动的，该范式量化了C（x）的（经验估计的）局部排名复杂度和对估计的^C的信心。为了量化局部排名复杂度，我们使用了差距（x） [17,9,28]。对于任何x∈ 十、用u（1）（X）<u（2）（X）<…<表示u（L）（x）在x和（x）：=u（1）（x）- u（2）（x）最佳（最小）和次优响应之间的差距。（x）测量确定C（x）的难度：对于u（1）的位置- u（2）很大，我们不需要高精度，因为相应的最小响应面很容易识别；相反，对于u（1）的位置-u（2）很小，我们需要更高的精度。因此，我们希望在以下情况下优先取样：（x）它很小。这是通过基于估计的gapsb的实验设计决策来实现的（x）。在L上的设计方面，exploration建议将预算用于学习能够获得最大信息收益的响应。也就是说，通过将注意力集中在（两）个最有希望的表面u（1）和u（2）上，区分采样指数，可以获得巨大的好处。这种策略比对每个Y\'进行简单的相等采样要有效得多。此外，由于Y\'中的噪声级可能随`而变化，因此也必须考虑到这一点。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-9 03:56:43

总之，我们的预期改进指标融合了经验差距B 以及基于克里格方差δ`（x）的经验后验不确定性，共同区分x×L。我们的贡献可以沿着三个方向追踪。首先，我们介绍并分析了一个针对损失函数（1.3）的新颖的序列设计问题。这种设置的动机是动态编程算法，自20世纪90年代末以来，统计响应模型已被广泛应用[15,33]。在这里，我们提出了一个贝叶斯顺序设计框架，可以节省大量的计算量，从而为这篇文献做出贡献。在复杂的模型中，这一方面变得尤为重要，因为模拟成本高昂，并形成了主要的计算瓶颈。其次，我们将贝叶斯优化和轮廓搜索的现有文献推广到多曲面设置，这就需要构建新的EI度量，以解决空间和索引维度上的联合设计问题。我们证明，这可以实现效率的双重提高：inX和L。第三，我们将[17]中的多匪徒问题扩展到了匪徒连续体的情况，这需要为各自的武器支付建立一个完整的元模型。我们的构建提供了一个替代最近关于X武装匪徒的工作[8]，并为MAB和DoE之间的联系开辟了新的前景。我们的方法还推广了Gramacy和Ludkovski[22]。后一项工作提出了轮廓查找情况下的顺序设计，其中设计仅在输入空间X上进行。在此背景下[22]介绍了几种EI启发法，并建议使用动态树进行响应建模。然而，本文的框架需要一种相当不同的方法，特别是我们强调了多个响应面同时建模时产生的受bandit启发的工具（如UCB）。论文的其余部分组织如下。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-9 03:56:46

第2节描述了我们采用的用于排序响应曲面5的克里格响应曲面序列设计方法，以及一些有助于排序的分析公式。第3节接着发展了（1.1）的预期改进启发法。第4节和第5节分别说明了使用合成数据（已知基本事实）和流行病管理的案例研究设计的算法。最后，第6节得出结论。1.3. 与随机控制的联系。考虑与受控状态过程X，c（0；u0:T）=TXt=0g（T，Xt，ut）（1.5）在{0，1，…，T}上相关的总成本最小化的目标。上面的g（t，x，u）编码了阶段运行成本，u0：是在有限行动空间中取值的控制策略∈ 五十、和Xt≡ 具有状态空间X的随机离散时间马尔可夫状态过程对于某些映射F:X×L×R，Xuare的动力学形式为xut+1=F（Xt，ut，ξt+1）→ 十、式中，ξt+1是一个随机的独立中心噪声源。绩效标准优化了预期奖励，这些奖励在价值函数V（0，x），V（t，x）：=input:t中得到∈UE[c（t；ut:t）|Xt=x]，t∈ {0,1，…，T}，x∈ 十、所有可容许的闭环马尔可夫策略ut:T∈ 因此，在时间t，动作ut≡u（t，Xt）在反馈形式中被指定为当前状态Xt的函数。政策地图（t，x）7→U*（t，x）将系统状态转换为动作，并通过动态编程方程（DPE）与值函数相关：V（t，x）=minu∈Lg（t，x，u）+EtV（t+1，Xut+1）（十）= uu*（x；t），（1.6）与uu（x；t）：=g（t，x，u）+Et[V（t+1，Xut+1）]（x）。（1.7）符号Et[·]（x）≡ E[·| Xt=x]旨在强调基于系统状态Xt=x总结的时间t信息的随机未来att+1的平均值。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-9 03:56:50

术语uu（x；t）是Q值，提供了应用行动u时的预期成本∈ L在Xt=x时。求解DPE相当于计算Q值，因为由（1.6），V（t，x）=min`∈L{u`（x；t）}。（1.1）中的排名问题被称为策略图x7→ U*（t，x）将状态空间x划分为L个动作集Ci（t）。给你*（s，·）对于所有s=t+1，T和所有x∈ X（通过v（T，X）=g（T，X）），我们观察到uu（X；T）=g（T，X，u）+Et“TXn=T+1g（n，Xeun，eun）#（X），（1.8），其中（eut）是在T和u处使用动作u的策略*（s，Xs）之后，s>t。实际上，（1.8）中的和正是路径成本的随机变量。因此，损失（1.3）是指作为u*（t，Xt）在t，相对于采取行动（然后在未来的剩余时间，{t+1，…，t}），由Xt的分布F（dx）加权。公式（1.8）允许通过将（1.7）中的准确性与（估计）Q值uu（·t）的即时精确性，而是与政策地图6 Ruimeng Hu和Michael Ludkovskiu的质量联系起来，来寻求政策搜索方法*（t，x）。也就是说，我们迭代地计算s=T的近似策略映射^u（s，·）-1，T-2.利用（1.8）构造基于{u（s，·）：s>t}的^u（t，·）。请注意，发现V（0，x）的最初目标要求解决形式（1.1）的T排序问题。当动作空间L为verysmall时，这种动态规划方法尤其有吸引力。一个典型的例子是最优停止问题，其中L={stop，continue}，即L=2。对于单个停止决策，通常会给出即时奖励u（x；t），从而导致估计单个Q值u（x；t），请参见[22]。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

何人来此

2022-5-9 03:56:53

在摇摆期权的定价[38]、实物期权的估值[1]和进出口交易策略的优化[48]中出现了同时需要估计μ和μ的多个停止问题。在评估能源资产，尤其是天然气储存[31]时，考虑了L>2的情况，这会导致最优切换问题。例如，存储决策通常根据{inject，do]的三个可选L=3进行建模- 没什么，撤退。小的行动空间也出现在许多工程环境中，例如目标跟踪[2,27]和传感器管理[16]。统计模型。2.1. 顺序设计。{a}和{1}对应的配置。大小为K的设计是一个集合Z（K）：=（x，`）1:K，x∈ 十、 `∈ 五十、上标表示向量。固定Z（K），并对相应的样本Y1:K进行调节≡ （Y`k（xk））Kk=1，设^C（k）≡^C（Y1:K，Z（K））是C的估计值。我们的目标是在所有大小为K的设计中最小化预期损失L（^C（·，Z（K）），C），即infZ:|Z |=KEhL（^C（Y1:K，Z），C）i，（2.1），其中期望值超过采样响应Y1:K。为了解决（2.1）我们使用顺序算法，在收集Y样本时迭代增加设计Z。临时设计SZ（k）根据其尺寸k进行相应索引，其中k=k，k+1，K.在每个步骤中，添加一个新位置（xk+1，`K+1），并根据新获得的信息重新计算估计值^C（K+1）。整个过程由以下伪代码总结：1。初始化Z（K）和^C（K）2。循环k=k。（a）选择一个新的位置（xk+1，`k+1），并对相应的yk+1进行采样：=Y`k+1（xk+1）（b）增加设计Z（k+1）=Z（k）∪ {（xk+1，`k+1）}（c）通过同化新观测3更新分类^c（k+1）=^c（Y1：（k+1），Z（k+1））。结束循环基本贪婪采样算法添加位置，目的是最小化近视预期估计误差。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

mingdashike22

2022-5-9 03:56:56

更准确地说，在步骤k，给定设计Z（k）（以及相应的Y1:k），下一对xk+1，`k+1由arg inf（xk+1，`k+1）选择∈X×LEhL（^C（Y1:（k+1），Z（k+1）），C）i，（2.2），其中期望值超过下一个样本Y`k+1（xk+1）。与K维优化相比，这导致了一个更简单的一步优化（通常我们关注的是K维优化） 100）公式化（2.1）。不幸的是，（2.2）中的优化通常仍然难以解决，因为它需要在每一步重新计算全损失函数L（·，C）；对响应面进行排序的顺序设计7o根据Y`k+1（xk+1）确定^C的预期变化积分Y`k+1（xk+1）的（通常未知）分布在完整的d+1维设计空间X×L上进行优化。因此，我们提出了（2.2）的有效数值近似，依赖于（i）序列统计建模（即随着Z的增长计算和更新^C）和（ii）随机优化（即确定有希望的新设计点（X，`））。2.2。响应面建模。顺序设计的一个关键方面是自适应评估近似质量，以最大限度地从新样本中获取信息。因此，测量预测不确定度是选择的核心（xk+1，`k+1）。为此，我们使用阿巴斯范式，将u`视为随机对象。因此，我们使用函数空间M，并假设`∈ M具有一些先验分布F。因此，对于每个x，u`（x）是一个随机变量，其后验分布基于从样本（x，`，y`（x））收集的信息进行更新。给定第k步设计Z（k）产生的信息，Fk=σY`（x）：（x，`）∈ Z（k）, 我们定义了后M（k）`（x）~ u`（x）|Fk。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

mingdashike22

2022-5-9 03:57:00

随机变量M（k）`（x）是关于以Fk为条件的u`（x）的信念；它的前两个矩分别称为克里格均值和方差，bu（k）`（x）：=E[u`（x）|Fk]，（2.3）δ（k）`（x）：=E[（u`（x）- bu（k）`（x））|Fk]。（2.4）我们将使用bu（x）作为u`（x）的点估计，δ`（x）作为各自不确定度的基本度量。全球总地图x7→ M（k）`（x）被称为“厚度表面”。请注意，虽然X上存在空间相关结构，但我们假设观测值在L（SOL）样本噪声中是独立的`⊥⊥ u`），因此后验数M（k）`（x），`=1，2。他们是独立的。顺序统计bu（1）（x）≤ bu（2）（x）≤ . . . 描述固定x下的排序后均值。自然定义是宣布最小估计曲面（2.5）^C（x）：=arg min`{bu`（x）}，即估计的分类^C对应于最小后均值，因此buC（x）（x）=bu（1）（x）。另一方面，关于C（x）的不确定性可以通过后验概率M，M，…，的期望最小值来概括，ML，m（k）（x）：=E[m（k）（1）]=E[min（u（x），…，uL（x））|Fk]。（2.6）观察E[min`u`（x）|Fk]=m（k）（x）≤ bu（k）（1）=min`E[u`（x）| Fk]，我们相应地定义了间隙（“M”表示最小值）M（x）：=bu（1）（x）- m（x）≥ 0.（2.7）M-gap测量最小预期响应和最小预期响应之间的差异，这与x in（1.3）的贝叶斯预期损失精确对应。这一事实提供了（1.3）中原始损失函数L（^C，C）的经验模拟EL（^C）：=ZXM（x）F（dx）。（2.8）上述公式将克里格曲面的局部精度转化为产生的Classifier^C的全局精度度量，并将成为我们算法的主要性能度量。8胡瑞梦和迈克尔·卢德科夫斯基2。3.克里格法。假设响应面在X轴上是光滑的。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-9 03:57:03

因此，关于u`（x）的信息也揭示了关于u`（x）的x 6=x，在不同地点的耦合观测。为了在没有参数表示的情况下实现这些条件，我们将每个u′视为来自阿加西过程（GP）的样本。GP由其趋势函数或平均函数t`（x）=E[u`（x）]和方差结构K`:x确定→ R、 K`（x，x）=E[（u`（x）-t`（x））（u`（x）-t`（x））]。通过指定相关行为，核K对响应曲面的平滑度进行编码。固定响应面指数`并让~y=（y（x），y（xn））t在位置~x=x1:n处对观察到的样本进行模拟。这些实现如（1.2）所示，响应表示为u`（x）=t`（x）+Z`（x），其中t`（·）是固定趋势项，Z`（·）是高斯过程的实现。给定样品（x，y）1:n，u′的后部再次形成GP；换句话说，任何集合M（n）`（x），M（n）`（xk）是多元高斯分布，具有均值bu（n）`（xi）、协方差v（n）`（xi，xj）和方差δ（n）`（xi），具体由[47，第2.7节]规定（另见[3]）：bu（n）`（xi）=t`（xi）+~k（n）`（xi t（k`+∑（n）`）-1（~y）-~t（n）`（2.9）v（n）`（xi，xj）=K`（xi，xj）-~k（n）`（xi）T（k`+∑（n）`）-1~k（n）`（xj）（2.10）与δ（n）`（xi）=v（n）`（xi，xi）~t（n）`=（t`（x），t`（xn））t和~k（n）`（xi）=（k`（x，xi），K`（xn，xi））T，∑（n）`:=diag（σ`（x），σ`（xn）），K`是n×n正有限矩阵（K`）i，j:=K`（xi，xj），1≤ i、 j≤ n、通过`，后验向量M（x）在固定的x满足度M（x）下的独立性~ N（bu（x），（x）当bu（x）=[bu（x），…，buL（x）]T，（x） =诊断δ（x），δL（x）.一个常见的选择是matren-5/2内核（x，x；s，θ）=s1 + (√5+5/3）kx- xkθ· E-√5kx-xkθ，kxkθ=qx diag~θxT。（2.11）长度比例参数向量~θ控制MK成员的平滑度，MK越小。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-9 03:57:06

方差标量参数决定响应中的波动幅度。序贯设计中克里格法的一个主要优点是更新公式，使新的数据点能够有效地模拟现有的数据点。也就是说，如果一个新样本（x，y）k+1被添加到一个现有的设计x1:k中，那么位置x处的均值和克里格方差将通过bu（k+1）（x）=bu（k）（x）+λ（x，xk+1；x1:k）（yk+1）更新- bu（k）（xk+1））；（2.12）δ（k+1）（x）=δ（k）（x）- λ（x，xk+1；x1:k）[σ（x（k+1））- bu（k）（xk+1）]，（2.13），其中λ（x，xk+1；x1:k）是一个权函数，用于指定新样品在xk+1onx处的影响（以现有设计位置x1:k为条件）。特别是，xk+1处后验标准偏差的局部减少与电流δ（k）（xk+1）[11]：δ（k+1）（xk+1）δ（k）（xk+1）=σ（xk+1）pσ（xk+1）+δ（k）（xk+1）成正比。（2.14）响应面排序的顺序设计9注意，更新后的后验方差δ（k+1）（x）是xk+1的确定函数，与yk+1无关。在下面的例子中，我们使用了DiceKriging R包[45]来计算（2.9）。该软件将位置索引对（x，`）1:n、相应样本y`（x）1:n、噪声级σ`n（xn）以及核族（默认情况下为Matern-5/2（2.11））和趋势基函数ti`（x）作为输入，并运行EM MLE算法来估计描述克里格核K`.2.4的超参数s，θ。排名统计摘要。给定一个固定的克里格曲面M`（·）（为了便于说明，在本节中，我们省略了设计尺寸k的索引），相应的分类^C如（2.5）所示。注意，^C（x）不一定是MAP（最大后验概率）估计器，因为后验概率和后验均值的顺序不需要匹配L>2。对于研究^C的准确性，还有两个量很重要：间隙和后验概率。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-9 03:57:10

首先，差距量化了后均值之间的差异，即b`（x）：=|bu`（x）- minj6=`buj（x）|，（2.15）b（x）：=|bu（1）（x）- bu（2）（x）|，（2.16），其中bu（1）≤ bu（2）≤ . . . ≤ bu（L）是有序后验均值。B=2，我们注意到(·) ≡B（·）=b（·）由于对称。其次，确定最小rankp`（x）：=P的后验概率u`（x）=u（1）（x）|Fk= P（M`（x）=minjMj（x））。（2.17）我们指的是p（1）（x）≥ p（2）（x）≥ . . . ≥ p（L）（x）作为向量~p（x）的降序值：={p`（x）}L`=1，因此p（1）（x）的指数是最小响应曲面的映射估计。以下命题提供了一个半解析递归公式，用于计算克立格均值和方差（bu`（x），δ`（x））的~p（x）。命题2.1（Azimi等人[5]）。如果M（x）~ N（bu（x），（x）），然后对任何∈ 五十、（2.18）p`（x）=pM`（x）=minjMj（x）=L-1Yj=1Φ-r（`）j,式中Φ（·）是标准正常cdf，r（`）=[r，r，…，rL-1] T=（A（`）（x） A（`T）-1/2A（`）bu（x），带（`）A（L- 1） x L矩阵定义为viaA（`i，j）=1如果j=`，-1如果1≤ i=j<`，或`<i+1=j≤ 五十、否则为0。推论2.2。对于L=2，我们有p（x）=p（M（x）≤ M（x））=Φbu（x）-bu（x）√δ（x）+δ（x）, p（x）=1- p（x）。下一个命题提供了另一个半解析公式来计算（2.6）中定义的m（x）。10胡瑞蒙和迈克尔·卢德科夫斯基命题2.3。假设L=2，设M`（x）~ N（bu`（x），δ`（x）），`=1，2是两个独立的高斯数。定义：=qδ（x）+δ（x），和a:=（bu（x）- bu（x））/d。那么M（1）（x）=min（M（x），M（x））的前两个矩由以下公式给出：M（x）≡ E[M（1）（x）]=bu（x）Φ(-a） +bu（x）Φ（a）- dφ（a），（2.19）EM（1）（x）= （bu（x）+δ（x））Φ(-a） +（bu（x）+δ（x））Φ（a）（2.20）- （bu（x）+bu（x））dφ（a）。方程（2.19）提供了一个封闭形式的表达式，用于计算L=2时的m（x）=E[m（1）（x）]。在L>2的情况下，可以使用高斯近似递归地计算m（x）。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

nandehutu2022

2022-5-9 03:57:13

例如，对于L=3，近似值Ey:=M（x）∧ M（x）由一个高斯随机变量，其均值/方差分别为（2.19）-（2.20）（即使用a和d），然后将命题2.3一次应用于M（1）（x）=eY∧ M（x）。预期的改善。序列设计的贝叶斯方法是基于贪婪优化采集函数。优化通过预期改善（EI）分数进行量化，该分数确定了根据（2.2）在降低全局经验允许函数EL方面最有希望的配对（x，`）。在我们的上下文中，EI分数是基于后验分布M（k）`的，它总结了迄今为止关于u`（x）的信息。我们的两个主要启发式算法被称为Gap UCB和Gap SUR:EGap-UCBk（x，`）：=-B`（x） +γkδ`（x）；（3.1）EGap-SURk（x，`）：=E[M（k）（x）- M（k+1）（x）|xk+1=x，`k+1=`，Fk]。（3.2）差距UCB分数是由MAB和偏好中的勘探开发权衡决定的，后验平均值差距小，克里格方差高。事实上，当地的经验GAP测量[17]b`（x）确定最有希望的arm，而克里格方差δ`（x）促进勘探，以减少arm支付的不确定性。两者通过UCB（置信上限[46]）调节参数γK连接，该参数平衡勘探（δ`（x）高的区域）和开采（间隙小的区域）。Gap UCB的另一种解释是模仿一种复杂的抽样方案，该方案根据潜在排名问题的复杂性选择设计地点。事实上，差距`（x）：=u`（x）- minj6=`uj（x）测量测试的硬度，无论u`（x）=miniui（x）；较小的`（x）更难。同时，克里格方差δ（x）可以与从x处采样获得的信息增益有关（类似于apoint估计器的标准误差）。Gap SUR策略是从仿真优化的角度提出的。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-9 03:57:17

重申我们努力降低（2.8）中的经验损失EL，这与（3.2）中的M缺口有关，EL=RM（x）F（dx）。因此，如果我们在设计中添加（x，`），Gap SUR准则将使用M（x）来指导自适应设计，目的是最大化其预期的局部减少。[6,10]中引入了这种逐步减少不确定性（SUR）的策略。（3.2）的评估要求计算M（1）（x）和M`（x）的预期均值和方差。更新公式（2.12）意味着（保持K固定）E[buK+1`（x）|xk+1=x，`K+1=`，Fk]=buK`（x），而（2.14）产生δ（K+1）`（x）。鉴于命题2.3，剩下的计算变得简单明了。对响应面进行排序的顺序设计11备注3.1。Gap SUR还与主动学习Cohn（ALC）[14]方法有关。在ALC中，后验方差的最小化是通过贪婪地最大化约化系数δ（x）来实现的。在Gap-SUR中，通过最大化M（x）的减少来实现EL的最小化。ALC范式提出了（3.1）的替代方案，即EGap-ALCk（x，`）=-B`（x） +γk[δ（k）`（x）-δ（k+1）`（x）]，它将克里格方差的预期下降与估计的差距混合在一起。渐近行为。Gap-SUR方法旨在将M-gaps设置为零，这相当于学习所有响应：M（x）=0<=> δ`（x）=0`, 见（3.2）。对于GP模型，在x处消失后验方差对应于在x附近密集的设计。因此，渐进地，Gap SUR启发式将生成在x×L上密集的设计。最后，可以调用先前关于GP模型一致性的结果（例如[13]），以确定^C→ C.另一方面，正确选择UCB计划（γk）对Gap UCB的性能至关重要。如果γk≡ 0则不能保证收敛。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-9 03:57:20

事实上，考虑x，x（x） >（x），但基于临时Z（k）满意度b的估计差距（x） >b（x） >（x）由于x处的估计误差。然后在k阶段，算法将更倾向于x上方的站点（因为其gapb较小）) 然后可能会被不确定地困住，永远不会意识到（x）及（x）这是错误的。因此，如果没有UCB，该算法容易陷入局部极小值. 同时，任意增加的无界γk→ +∞ 保证supxδ（k）`（x）→ 0`. 为此，Srinivas等人[46]证明，在累积后悔设置中γk=O(√对数k）应在样本量k中对数增长。关于如何选择γk（对于有限状态空间X的情况）的更多规则可在[17]中找到。另一种选择是一个本地化版本。例如，在-贪婪抽样，概率抽样在任何一个步骤中，代替使用EI度量，（x，`）k+1在x×L中被均匀选择。这确保了设计Z（k）在x作为k时是稠密的→ ∞ 这是我们在实验中使用的一个特征。尽管如此，仍需调整K7的时间表→ γkis在黑盒设置中非常重要。因此，GAP UCB方法的使用对实现选择非常敏感，关于选择（γk）的进一步指导留给未来的研究。3.1. 选择下一个样本位置。将设计Z（k）增长到k=k，k+1。我们通过贪婪抽样策略（x，`）k+1=arg sup（x，`）使用EI分数∈X×LEk（X，`）。（3.3）因为上面介绍了一个全新的优化子问题，在计算上不需要的情况下，我们将替换arg supx∈带MaxArg的Xx∈TWT是一个有限的候选集。然后通过直接检查对T进行优化。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

何人来此

2022-5-9 03:57:23

该程序的合理之处在于：（i）我们预计Ek（x，`）在x方向上是平滑的，而且在x方向上是相对平滑的*; （ii）Ek（x，`）已经是一个近似值，因此无需对其进行精确优化；（iii）优化设计的性能应对采样位置的小扰动不敏感。为了在X中构造这样的候选集T，我们使用拉丁超立方体抽样（LHS）[37]。LHS候选人确保新位置具有代表性，且在X上间隔良好。关于T应如何设计的一些讨论，请参见[21，第3.4节]。此外，我们在每次操作中刷新候选集T，以启用“抖动”。下面的算法1以伪代码的形式给出了生成的方法。备注3.2。在克里格模型中，初始设计Z（K）对于算法学习响应的协方差结构至关重要。一个常见的挑战是避免12 Ruimeng Hu和Michael Ludkovski算法1使用KrigingRequire:K，K1：生成初始设计Z（K）：=（x，`）1:Kusing LHS2：样本y1:K，估计GP核K`\'并初始化响应面模型M`3：使用（2.5）4:K构建分类器C（K）（·）← K5：当k<kdo6：生成一个大小为D7的新候选集T（k）：计算每个x的预期改进（EI）Ek（x，`）∈ T，`∈ L8：选择一个新位置（x，`）k+1=arg max（x，`）∈T（k）×LEk（x，`）并对相应的yk+19进行采样：（可选）重新估计克里格核k`k+110：使用（2.12）-（2.13）11更新响应面M`k+1：使用（2.5）12更新分类C（k+1）：保存整个网格Z（k+1）← Z（k）∪ （xk+1，`k+1）13:k← k+114:end while15:return Estimated Classifier C（k）（·）。假设42u’的fluits（按比例计算）太短。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

何人来此

2022-5-9 03:57:28

因此，K必须足够大，以合理估计K`；一个建议是K应为最终设计尺寸K的20%左右。在我们的实施中，初始化通过空间填充LHS设计完成（在L表面上均匀取样）。另一个问题是在算法1的步骤9中重新估计克里金核K`。重新训练在计算上很昂贵，并且使GPframework不连续。因为我们期望算法收敛为k→ ∞, 我们采用的实际规则是，根据倍增法[18]对K运行完整的估计程序，重新估计K=2,4,8。二的幂，否则就冻住它。3.1.1. 分层和并行采样。而不是直接在对（x，`）上采样∈ X×L，可以考虑两步程序，首先选择X，然后选择`（反之亦然）。这种策略与标准的顺序设计相匹配，而不是X。实际上，人们可以直接遵循[36,14]中的主动学习方法，首先使用差距指标选择xk+1，然后根据克里格方差选择指数“k+1”：xk+1=arg minx∈Xb（x） |Fk，cf.（2.16）`k+1=arg max`∈Lδ（k）`（xk+1）。（3.4）在选择xk+1的条件下，上述选择选择选择具有较大克里格方差δ`（x）的曲面，尝试在`之间均衡δ`（x）。请注意，（3.4）将关注最不确定的响应，而不是最有希望的响应，当L 2.另一种选择是选择“k+1”以贪婪地最大化信息增益，如（2.14）所示。这样的两步EI启发法可以避免必须指定UCB标准（3.1）的时间表。另一个变体是每个u`（·）的并行边际建模。这是通过concurrentsampling实现的：在选择位置xk+1之后≡ x、一种是用L对（x，1），（x，2）。（x，L）。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-9 03:57:31

这种方法“并行化”所有响应面的学习，同时仍然采用顺序设计对响应面13进行排序，在X上构建自适应设计。当Y（X）的方差为零，σ（X）时，这种策略的缺点在极值情况下变得明显≡ 当Y（x）的噪声较大时为0。在这种情况下，在为每个响应（x，1）和（x，2）对给定位置进行一次采样后，我们将得到δ（x）=0，δ（x） 0.因此，来自Y（x）的另一个样本将完全无法获得任何信息，而实质性信息仍将从样本Y（x）中收集，使得平行样本的成本是所需成本的两倍。4.模拟实验。4.1. 玩具的例子。在本节中，我们将考虑一个简单的一维示例，其中包含综合数据，允许完全控制设置。设L=2，X=[0，1]。噪声响应Y（x）andY（x）由（参见[45，第4.4节]中的示例）Y（x）=u（x）+（十）≡sin（10x）1+x+2xcos（5x）+0.841+ σ（x）Z，Y（x）=u（x）+（十）≡ 0.5+σ（x）Z。这里Z\'是独立的标准高斯分布，噪声强度固定在σ（x）≡ 0.2和σ（x）≡ 0.1，在x中为同质，但在`=1,2中为异质。损失函数中的权重F（dx）=dx在X上是一致的。真正的排名等级C（X）由（4.1）C（X）=（2）表示∈ [0，r]∪ [r，1]1表示r<x<r，其中r≈ 0.3193，r≈ 0.9279.0.0.0.2 0.4 0.6 0.8 1.00.0 0.5 1.0 1.5xy●来自Y1的样本来自Y2u1（x）u2（x）真ui（x）0.000 0.015 EMPR的样本。损失0。0.2 0.4 0.6 0.8 1.0EI0 0.0003x0。0.2 0.4 0.6 0.8 1.00.0 0.5 1.0 1.5xy●来自Y1的样本来自Y2u1（x）u2（x）真ui（x）0.000 0.008Empr的样本。损失0。0.2 0.4 0.6 0.8 1.0EI0 4e-05xK=100k=400图1。响应面建模采用Gap SUR EI标准（3.2）。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-9 03:57:34

我们绘制了真实表面u`（x）（黑色虚线），后验意味着bu`（x）（蓝色/红色实线），M（x）和M（x）的90%后验可信区间（浅蓝色/红色区域），以及采样位置x1:Kfory（x）（蓝色三角形）和Y（x）（红色圆圈）。中间的面板显示了局部损失M（x），cf.（2.7），而底部的面板显示了metricEK上的间隙（x，`）（蓝色：`=1，红色：`=2）。为了关注各种采集函数的性能，我们使用超参数s=0.1、θ=0.18（Kand s=0.1）将克里格核K`固定为Matern-5/2类型（2.11），θ=1表示K。这些超参数接近于通过训练Y`（x）14的克里格模型获得的超参数。Ruimeng Hu和Michael Ludkovski给出了x上的密集设计，因此很好地捕捉了上面响应面的平滑度。我们使用固定趋势t`（x）=0.5，并将给定的采样噪声σ`视为已知。为了应用算法1，我们用K=10个位置（x，`）1:K（Y（x）和Y（x）各五个）进行初始化，这是从[0,1]上的LHS设计中得出的。注意，因为克里格核被认为是已知的，所以KI被认为是非常小的。为了增加设计，我们采用Gap SUR Eichrition，并根据尺寸为D=100的LHS设计，使用新的候选集T（k）为下一个（x，`）k+1进行优化。图1显示了后响应面模型的演变。这两个面板显示了K=100和K=400时估计的M（K）`（x）（即我们绘制了后验指数bu（K）`（x）和相应的90%置信区间bu（K）`（x）±1.645δ（K）`（x））。我们观察到，大多数样本严重集中在两个分类边界r、r以及x=0时的“假”边界周围。因此，在这些八个样本中，克里格方差δ`（x）要低得多，为m`（x）的后可信区间生成了独特的“香肠”形状。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-9 03:57:37

相比之下，在差距缩小的地区（x）较大（例如，x=0.5左右），对响应进行排序很容易，因此几乎不采集样本，克里格方差仍然很大。此外，由于σ（x）>σ（x），u的可信区间更紧，δ（x）>δ（x），超过70%的样本来自第一个响应Y。事实上，我们发现D（k）\'3D（k），其中di（k）：=|{1≤ K≤ K:`K=i}|是设计Z（K）中从第i个曲面开始的样本数。上述观察结果证实了EI分数取决于X和L维度的双重效率。从不同的角度来看，图2显示了本例中产生的设计Z（400）以及采样点的位置xkas，采样顺序k=1，400.我们观察到，算法首先进行探索，然后进入更具针对性的模式，在0左右的采样和r.x0之间交替。0.2 0.4 0.6 0.8 1.0比例0。16 0.1650 100 200 300 4000.0 0 0.2 0.4 0.6 0.8 1.0kx（k）●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●Y1样本Y2样本图2。左：设计Z（400）基于（3.2）的间隙表面标准。Yan和Yr分别有D（400）=294和D（400）=106个样本。右图：采样位置xka是k的函数（蓝色表示k=1，红色表示k=2）。EI标准的比较和讨论。作为比较的第一个基础，我们提供了三种非自适应设计。最简单的替代方法是统一抽样法，它特别依赖于大数定律来学习u`（x）。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-9 03:57:41

因此，在每个步骤k中，我们从x×L中生成一个新的样本集合（x，`）。这将生成一个大致相同数量的样本D（k）\'序列设计，用于从每个响应中对响应面15D（k）进行排序，以及一个在x中近似恒定的克里格方差δ`（x）。显然，这种方法产生了可能（经验）损失的上限。通过顺序设计实现的每一个可选空间的分离率；这改进了均匀采样，但没有以任何方式尝试在索引维度L中进行区分。对于本例，我们采用D=160=4与每个表面的观测噪声成比例。（请注意，该策略大致相当于使用采集函数Ek（x，`）：=δ`（x）构建全局序列最大化设计。）第三种选择是建立一个依赖于真u`（·）的抽样方案。基于这一远见，我们生成了一个设计，该设计依赖于通过插入真实数据来解析C（x）的实际复杂性`（x）进入（3.1）中的间隙UCB度量。因为采样完全取决于`（x）克里格方差δ（k）`（x）由之前的x1:k，cf.（2.10）迭代确定，总体设计x1:Kis是确定性的（因此是非自适应的，但仍按顺序实施）。请注意，由此产生的bu`（·）以及由此输出的^C（·）仍然是Y1:K的函数。可以根据分类框架设计用于评估预期改进的其他几种备选方案。对于分类，主要的后验统计量是u`（x）的概率p`（x）是最小的响应。然后可以使用向量p（x）来测量x处产生的局部分类的复杂性。请注意，这种测量本质上是在`之间聚合的，因此只依赖于x。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-9 03:57:44

这建议使用第3节中的两步取样程序。1.1或建立（3.1）中类似UCB的标准。我们采用后一种方法，将判别x位置的标准Γ（x）与UCB相结合（更大的分数优先），从而得出形式为Ek（x，`）=Γ（k）（x）+γkδ`（x）的EISCORE。Γ（·）有三种不同的选择：ΓENT（x）：=-X`p`（X）log p`（X）；ΓBvSB（x）：=-[pBest（x）- pSB（x）]；（4.3）最佳（x）：=-pBest（x），（4.4），其中pBest（x）：=P^C（x）=C（x）|Fk= p^C（x）是后验概率，即最低后验概率确实是最小响应，pSBis是第二最低后验概率，即最小响应。ΓENTmetric是后验熵，它是分类复杂性的标准度量。高熵表明~p（x）中的扩散更大，因此更不确定~u（x）中哪个分量最小。然而，熵的一个众所周知的缺点是，对于大L（大于3），不太可能是最小值的响应（即小p`（x））仍然强烈影响整体ΓENT（x），导致EI分数的非直观形状。源自[30]的最佳与次最佳（BvSB）方法ΓBvSB（x），通过比较两个最低的后验平均值来抵消这种影响。PBEST和PSB之间的微小差异表明，在确定最小响应时存在很大的不确定性。然而，如果后验差δ`（x）’高度不相等，则BvSB度量可能会崩溃，因此bu′和p′之间的顺序不相同。否则，ΓbVSB与间隙测量B非常相似（x）。最后，ΓBest关注的是位置pBest（x） 1，即接近^C（x）分类边界的。当L=2时，Γbest和ΓBvSB=1- 2pBest（x）给出相同的偏好。注意，由于Γ不区分不同的表面，因此将γk=γk（`）作为响应特定值是明智的。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-9 03:57:48

或者，Γ度量适合于并行采样，其中16 Ruimeng Hu和Michael Ludkovski在X中构建了一个自适应序列设计，但平等地对待所有曲面：EConc-Γk（x）=Γ（k）（x）+γk[x`δ`（x）]。（4.5）另一种选择是所谓的纯M-Gap启发式，它使用（3.2）viaxk+1=arg maxx∈T（k）M（x），`k+1=arg max`δ`（xk+1）。（4.6）这种分层抽样策略可被视为将[29]的高效全局优化（EGO）标准推广到排名问题，参见[24]中EGO的分类变量。表1一维示例中Z（200）的真实损失与经验损失。对于UCB启发法，冷却计划的形式为γk=c√用c记录k，如下所示。错误概率ErrP rob测量1的平均值- p（200）最佳（x）超过测试集。方法Emp损耗（SE）真损耗（SE）ErrProb（SE）DUniform采样2.89E-3（1.24E-4）2.64E-3（2.67E-4）6.87%（0.25%）100非自适应LHS 2.16E-3（1.01E-4）1.91E-3（2.12E-4）6.05%（0.22%）160已知间隙UCB，（1.91E-4）5.61%（0.23%）174.17%174.17%（0.15%）17172（2.33E-4）4.28%（0.15%）1717172并发M-Gap 1.36E-3（4.98E-5）4.36E-3（4.98E-5）5.98E-5）1.19E-3（1.19E-3（1.19E-3（1.9 E-3（1.84E-5）3（1.84E-5）3（1.84E-4）3（1.84E-4）3（1-4）3（1.84E-4）4）3（1.4）3（1.84E-4）3（1-4）4）4）3（1.4）3（1.4）3（1.4）3）3（1.4）3（1.4）3（1.84E-4）3）3 3（2.60E-4）5.46%（0.23%）163Gap UCB，5.16%（0.19）1.62E-3（2.14E-4）1.62E-3（7.29E-5）1.62E-3（2.14E-4）2.14E-4）5.10%（2.14 E-4）5.10%（2.14 E-4）5.10%（0.14 E-4）5.10%（0.20%）1760.10%（0.20）176UCB）176UCB差距UCB，c=1.10（5.10.10.10.10.10%（5.10.10.10.10.10）差距UCB（5.10.10.10.10）差距UCB、176B、176B、176B、176B、c=1.10（0.10.10.10.10.10（0.10.10.10.10.10.10.10.10）差距UCB）差距UCB、176B、176B、c=1.10（0.10.10.10 3（5.85E-5）1.35E-3（1.71E-4）4.53%（0.17%）172ΓEN T-UCB，c=5 1.14E-3（6.02E-5）1.33E-3（1.80E-4）4.22%（0.18%）169差距与培训K1。20E-3（5.87E-5）1.69E-3（3.24E-4）4.34%（0.37%）1464.3。基准。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-9 03:57:51

为了判断不同顺序设计的效率，我们继续对不同方法的性能进行基准测试。表1和图3比较了EI采集功能的性能，包括三种非自适应方法；南峡；Gap UCB具有不同的γk-时间表；方法基于后验概率p（·）：基于（4.2）的ΓENT-UCB熵准则和基于（4.4）的ΓBest UCB准则；纯M-gap启发式（4.6）；同时使用M-Gap进行采样。为了构建表1中的汇总统计数据，我们使用大小为K=10的随机LHS设计初始化了每个算法，并将其扩充到K=200个站点。自始至终，我们计算了已知u`（x）的合成示例中的真实损耗，以及近似的经验损耗ELEL（^C，C）=MMXj=1bu（1）（j）十）- m（j）十）,（4.7）我们使用M=1000=1/x=0,1]中的x等距网格点。报告的另一个度量是错误概率1- p（K）Best（x），用于衡量排序响应面17的顺序设计确定的最小响应不正确的后验概率。每种方法运行100次，以计算损失函数L和经验损失EL的结果平均值和标准偏差。为了隔离EI标准的影响，我们继续使用固定的GP协方差结构K`表示u′s和预先指定的σ′（参见第4.1节中的超参数值）。Gap-SUR算法似乎是最有效的，尤其是比原始均匀采样器（或非自适应LHS采样器）更有效。它的性能也比Gap UCB或纯M-Gap方法更好，而且在整个算法运行中的波动最小，表明其行为更稳定。然而，UCB方法几乎同样优秀，尤其是基于熵的ΓENT-UCB方法具有竞争力。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝