全部版块 我的主页
论坛 经济学人 二区 外文文献专区
2022-6-9 21:15:31
库存过剩不会得到任何补偿,缺货会受到严厉的惩罚(市价的200%)。因此,成熟度的值函数在I中具有非光滑的曲棍球棒形状,其斜率为零<1000,斜率为-2总的来说。提取和注射速率取决于库存,由CWDR(I)=-k√I和cinj(I)=krI+k-k、 这些功能规范源自储气设施的物理流体力学,见【34】。库存的结果动态为:Itk+1=Itk+cwdr(Itk)t、 如果mtk=-1(撤回);如果mtk=0,则为0;(cinj(Itk)-k)t、 如果mtk=+1(注入)。(25)常数K测量注入成本,其表示为“气体损失”。这导致生产和注入之间存在一个适当的差距,因此不采取任何行动(m*= 0)如果价格“接近”平均水平,将是最佳措施,Pt≈ P在下面的数值实验中,我们将T离散为K=1000步,以便t=0.001T,其余参数列于表1中。切换成本取零K(i,j)≡0i、 j.无切换成本将(17)中连续函数q(tk,·)中的状态变量减少到(Ptk,Itk+1)。因此,在本例中,每个时间步都需要2D value函数的一个投影。α=2.38,σ=0.59,P=6k=2040.41,k=7.3·10,k=500,k=2500,k=620.5Imax=2000 MMcf,T=3,t=0.003,r=10%。表1:第6.6.2节“基准设置”中储气设施的参数,用于基准性能,我们比较了使用传统产品设计P×G(库存均匀离散化)的两种方案:3次全局多项式近似over(P,I)(PR-2D)和分段连续近似(在每个库存水平Ik,PR-1D上具有3次多项式回归)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-9 21:15:34
这些可以被视为具有联合回归的“经典”TvR方案【10,14】,以及【3,4,7,30】所使用的离散化-I版本。此外,在不同的设计上采用五种回归方法(PR-1D、GP-1D、PR-2D、黄土-2D和GP-2D),模拟预算为:N’10K、40K、100K:o通过LHS实施的随机空间填充设计(分段连续回归和Lotherwise为L×G)。我们使用一个大的保守输入域P∈ [2, 10].o 混合料-2D设计,40%的场地来自空间填充,其余60%来自接缝温度分布P,DM:=P(0.6N)∪L(0.4N)。为了实现P,我们需要估计pp(tk,·)和pI(tk,·)。这是通过首先以较小的预算和传统的产品设计运行算法来实现的。然后,我们生成前向路径(Pntk,^Intk)来估计tk处的关节(pP(tk,·),^pI(tk,·))。随着合同接近到期,边际分布^pI(tk,·)开始集中在I=1000附近,因此该领域其他部分的分辨率降低,并使用Lis来补偿这种影响自适应1D:对于1D回归,我们如上所述估计pP(tk,·),然后非均匀分解库存,以纳入最优控制库存过程集中在Imin、Imax和I=1000周围的事实。附录A中详细说明了每个模拟预算的离散化水平。动态时间相关设计改变了模拟预算Ntkacross tk。我们使用规范Ntk(N(1),N(2)):=N(1){k<900}+N(2){k≥900}这样(大约)0.9N(1)+0.1N(2)∈ {10K、40K、100K}。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-9 21:15:38
附录中的表5给出了具体规格。我们使用了它的两种变体:–固定投影空间H(即GP-1D)和常规产品设计D=P×G。–时间相关投影和设计,即GP-2D和混合设计用于k<900,PR-1D和常规设计用于k≥ 上述动态方案的动机是通过投入更大的模拟预算以及使用-1D回归,更好地处理非光滑终端条件。对于GP,我们使用Matlab的内置实现fitrgp。对于黄土,我们再次使用Matlab中的curvefittingtoolbox,该工具箱基于三立方权重函数κ(x*, xn)=1.- (| x)*-xn |λ(d,x*)). λ(d,x)以上*) 是x的欧几里德距离*到跨度d中最远的xKw。我们使用默认跨度d=25%,将P保持在其原始比例上,并将比例I重新调整为范围[0,2]。为了减少HGPR和黄土的回归开销,我们在基础设计类型的基础上使用了丁腈橡胶(见附录A)的分批设计。为了比较不同设计/回归的性能,我们使用P=6,I=1000时的值函数^V(0,P,I)的估计值,使用N=10000的固定样本路径集(即固定Pn0:T)作为性能度量。6.3结果表2显示了不同设计和回归方法的性能。我们继续讨论三个不同方面的结果:(i)不同回归方案的影响,特别是参数PR与非参数GP和黄土方法;(ii)模拟设计的影响;(iii)接头-2D vs。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-9 21:15:41
插值-1D方法。首先,我们的结果证实,插值1D方法在这个经典示例中表现非常好,完美地利用了具有一维库存变量的二维设置。从这个意义上讲,现有的最先进技术已经非常优秀了。这有两个重要原因。第一个PR-1D高度灵活,有很多自由度,允许良好的安装(由于1D设置,过度安装的危险降至最低)。其次,PR-1D完美地利用了价值函数在库存中几乎(分段)线性的事实。我们通过用GP-1D替换PR-1D获得了轻微的改进;另一个微小的收获是用自适应方法代替等间距库存离散化,使更多的级别接近库存边界。作为进一步的增强,动态设计利用了一种依赖于步长的模拟预算(由于非光滑的“曲棍球棒”终端条件,需要更多的努力才能从统计上学习,从而获得边界层效应),从而带来了显著的改善,突出了跨时间步长混合和匹配近似策略的潜在好处。通过采用依赖时间的方法,可以有效地节省仿真预算(例如,动态GP-1D的估值N=10与自适应GP-1D的估值N=2·10相当)。然而,正如我们反复强调的那样,-1D方法的范围必然有限,尤其是当添加更多的因素/库存变量时,不能进行缩放。1D方法的另一个限制是它们对产品设计的要求。更通用的二元2D回归对所有状态变量进行了统计上的公平处理,因此允许任意模拟设计。由此产生的潜在实现的巨大范围既是福也是祸。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-9 21:15:44
因此,我们记录了在选择回归方案和选择模拟设计方面的一些好的和一些坏的选择。我们发现,PR-2D往往表现不佳,这并不奇怪,因为它对连续值实施了严格的参数化形状,灵活性空间不足。同样,我们观察到黄土的中等性能;另一方面,探地雷达通常工作得很好。将我们的注意力转向不同的2D模拟设计,我们将传统的P×G选择与3种备选方案进行比较:在大输入域上填充保守的空间;联合概率设计P;混合前两者的混合物设计。我们发现,普通空间和联合概率都不能很好地工作;第一个目标不够明确,在对^V贡献不大的地区花费了太多预算;第二种方法过于激进,通常在计算^m时,requiresextrapolation会产生不准确的预测。相比之下,混合料设计(我们发现60/40的混合料效果良好)是一个赢家,显著优于传统的混合料设计。特别是,混合设计的GP-2D是唯一一个与GP-1D并驾齐驱的二元回归方案。这一点很重要,因为与GP-1D不同,GP-2D可以直接扩展到更高的维度,并且不需要产品设计(或通常速度较慢的任何插值)。这些发现突出了设计选择中提案密度的重要性。为了突出我们算法的灵活性,我们还提出了另一种结合自适应PR-1D和混合GP-2D的动态设计。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-9 21:15:47
这种组合保持了相同的精确度,但由于PR-1D的回归开销较低,运行速度快了约10-15%。回归模拟预算设计方案中低规模常规PR-1D 4965 5097 5231GP-1D 4968 5107 5247PR-2D 4869 4888 4891黄土-2D 4910 4969 5011GP-2D 4652 5161 5243空间-fillingPR-1D 4768 4889 5028GP-1D 4854 5064 5224PR-2D 4762 4789 4792黄土-2D 4747 4912 4934GP-2D 4976 5080 5133自适应1DPR-1D 5061 5187 5246GP-1D 5079 5195 5245动态CGP-1D 51325225 5266混合5137 5205 5228混合物2DPR-2D 4820 4835 4834黄土-2D 4960 4987 5003GP-2D 5137 5210 5233表2:使用不同的设计回归对和三个模拟预算进行估值^V(0,61000)(千):低N’10K,中N’40K,大N’100K,参见附录A。估价是每个方案10次运行的平均值,但预算较大的黄土-2D除外:由于黄土的管理费用过高,仅进行了一次运行。P设计对-1D方法的影响。在注重P回归和I离散+插值的-1D方法中,将设计从P×G改为空间填充L×G对所有方法都有不利影响,例如,PR-1D观察到估值下降了200K以上(参见右图4)。此外,使用空间填充但“粗略”模仿Pt分布的中间设计(例如,范围内60%的站点∈ [4.5,7.5],P=4.5以下20%,P=7.5以上20%)在L×G和P×G之间插入估值,确认P维度设计的重大影响。I维模拟设计的形状在评估中具有同样重要的作用。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-9 21:15:50
通过比较传统PR-1D和自适应PR-1D(表2)的性能可以观察到这一点,它们基于PTP的边际分布共享相同的P-P设计,但使用不同的方法离散库存。自适应设计中的非均匀离散化提高了接近Imin、Imax和I=1000的精度,并导致相对于传统设计的更高估值,还有一个额外的优势,即我们不需要在内存中存储数十万条路径。使用GPR可视化设计影响。除了更高的估值外,GPR还提供了一种通过后验标准差量化设计效果的自然方法。在图5中,我们绘制了基于混合和空间填充2D设计的后验GP标准偏差s(x)(局部估计标准误差的代理)。这显示了设计形状和探地雷达学习精度之间的直接联系。对于空间填充设计,我们观察到一个恒定的后验方差,即GPR在回归域内部学习^q(tk,·)同样好。相比之下,[Pmin,Pmax]×[Imin,Imax]边缘的后验标准差非常高,这对于在库存几乎为满或几乎为空时正确识别策略是个问题。对于混合料设计,与图3c中的联合概率设计销相比,后验方差反映了对角线上输入点的浓度。反过来,这有利于学习控制图,因为GPR预测沿切换边界最准确,见图2a。切换边界周围的更高精度允许混合料设计将模拟预算分配到最需要精度的区域,并且部分解释了与LHS设计相比更高的估值。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-9 21:15:54
我们强调,这种局部推理质量仅适用于非参数工具;像PR这样的全球计划不能直接从专注的设计中受益。2价格02004000600800100012001400160018002000库存6.56.56.588889.59.59.511111111313131515151515171717172 4 6 8价格02004000600800100012001600108002000库存9.59.51111111131313151515151717191919图5:设计对t=1.5年时探地雷达后验标准误差s(x)的影响。我们展示了x 7的轮廓→ s(x),带点,表示N=500个站点的基础各自设计。左面板:图3a的空间填充设计(Sobol QMC S)导致S(·)的矩形水平集。右面板:在混合设计下,s(·)类似于图3c中的销的形状。使用GPR复制设计。GPR的实施还需要管理设计站点数量NSA和复制量Nb之间的权衡。使用复制是必要的,因为拥有超过2000个不同的站点非常耗时,至少对于我们使用的GPR的有效实施来说是如此。在图6a的左窗格中,我们考虑了不同的Ns和Nb(因此N)。虽然较大的模拟预算明显改善了结果,但我们注意到,最终通过Ns固定增加NB并不能改善回归质量(尽管它仍能减少标准误差)。在图6b的右侧面板中,我们展示了Nsfor已执行总预算的影响N=Nb·Ns。我们发现,当NSI越大(即NBI越小)时,复制总体上是次优的,结果越好。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-9 21:15:57
为了管理最终的速度/精度权衡,我们建议采用Nb∈ [20, 50]; 例如,当N=10时,我们使用Ns=2000,Nb=50,当N=10时,我们使用Ns=500,Nb=20.10 20 40 100 160复制数量490049505005105150520020550评估设计站点=1000(a)复制的影响Nb250 500 1000 2000个设计站点485049505000505051051505205520550评估预算=100000(b)不同设计站点的影响NSFix图6:左面板:混合GP-2D的性能作为N的函数。我们确定唯一设计站点的数量Ns=1000,并逐步增加增加重复次数Nb,在P=6,I=1000时报告结果^V(0,P,I)。右图:增加固定N=10的NSF的影响。结果是每个算法运行20次。在每个方框图中,中心标记表示中值,方框表示第25和75个百分位,胡须表示最极端的跑步。值得注意的是:我们的实验表明了以下关键观察结果:(i)在inventorydiscretized-1D方法中,高斯过程回归在所有情况下都优于标准多项式回归,并且对“差”设计或低模拟预算更为稳健。(ii)在联合2D方案中,我们继续观察到GPR的性能优于交替双变量回归方案(黄土和PR)。此外,GP-2D与性能最好的GP-1D不相上下。我们强调,GPR和黄土的高效实施依赖于批量设计,这是我们DEA实施中的另一项创新。(iii)我们还发现,设计选择与性能之间存在着强烈的依赖性。我们确认,最佳结果来自于设计,例如我们实施的混合和动态版本,这些设计平衡了输入空间的填充和针对大多数(Pt,^It)轨迹所在的领域。否则,纯空间填充或逆向渐进边界会降低性能。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-9 21:16:01
(iv)在两种参数化方法PR1D和PR-2D之间,我们发现无论设计和模拟预算如何,PR-1D都显著优于PR-2D,表明分段连续回归的优势。6.4具有转换成本的储气库模型化我们通过合并转换成本来概括前面的示例。切换成本使控制图取决于当前的管理模式,并产生惯性,即倾向于继续使用相同的管理模式,以降低总体成本。为了处理离散的m维,我们将其视为| J |不同的连续函数,通过| J |不同的回归进行估计。否则,算法将以与之前完全相同的方式进行。这说明了DEA处理一系列问题公式的灵活性。除了通过k的注入损耗外,我们还添加了转换成本k(i,j),具体如下:k(-1,1)=K(0,1)=15000;K(1,-1) =K(0,-1) = 5000; K(1,0)=K(-1,0)=0,(26),即切换成本仅取决于控制器决定切换到的状态,切换到注入成本最高,切换到无动作。在图7中,我们展示了控制器针对不同制度的政策。由于相应的控制图具有最宽的存储区域,因此处于mtk=0状态的惯性很明显。当比较左侧和中间面板的存储区域时,K(i,j)的影响也很明显。如果控制器从注入模式切换到存储模式,由于切换成本,她会在尝试返回注入模式时发现更多阻力。(a) m=+1(注入)(b)m=0(存储)(c)m=-1(撤销)图7:t=2.7年时模型的控制图^m(t,P,I,m),转换成本为(26),对于m∈ {+1, 0, -1}. 颜色为^mt+t=+1(注入,浅黄色),^mt+t=0(储存,中青色),^mt+t=-1(撤回,深蓝色)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-9 21:16:04
解决方案采用GP-2D回归和混合设计。在表3中,我们展示了N=40K模拟预算的不同设计回归对的性能。我们从这个和下面的讨论中去掉了黄土,以简化表达式,还因为Matlab对黄土的实现不支持维数d>2。正如所料,转换成本的引入导致了相对于表2的较低估值。此外,相对性能与前一节相似,即空间填充设计的性能最差,混合料设计有显著改善,但动态设计最终赢得了比赛。通过比较表3和表2中的估价,我们可以推断出开关成本的影响和数量。例如,以前动态GP-1D的估值为^V(0,61000)=5266美元(千美元),然而,加上转换成本,现在是5102000美元。相应的16.6万美元的损失可以解释为在一条典型轨道上大约有16个政权切换(假设平均切换成本为1万美元)。6.5具有两种功能的3D测试用例我们工作的一个重要方面和动机是算法在输入维度数量方面的可伸缩性问题。在经典的存储问题中,只有两个维度:价格P和库存I。然而,在许多情况下,可能存在多个随机因素(例如下面的微电网示例中的电力需求和供应过程)或多个库存。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-9 21:16:08
相应的问题在概念上与所考虑的问题相同,只是X有d≥ 3个尺寸。处理这些问题需要数值方法对维度不可知。就现有方法而言,分段连续策略(如PR-1D)是最常用的设计回归^V(0,P,I)(\'000s)常规PR-1D 4901(12)PR-2D 4654(11)空间-llingPR-1D 4663(16)GP-1D 4757(10)PR-2D 4594(13)GP-2D 4879(22)自适应-1DPR-1D 4978(14)GP-1D 5058(12)动态CPR-1D 4997(17)GP-1D 5102(20)混合物2DPR-2D 4602(30)GP-2D 4978(8)表3:储气设施的估价不同设计回归对的切换成本^V(0,61000),模拟预算为N=40000。结果是每个算法10次运行的平均值(括号中的标准偏差)。成功,但它在很大程度上依赖于在单个库存变量中插值。相比之下,联合多项式回归在d中的可伸缩性很小,但通常表现较差。因此,非常需要其他能够改进PR的联合d方法。在本节中,我们将测试我们的算法和不同设计在向上移动到三维状态变量时的比较。其主要思想是考虑两个天然气储存设施的联合模型,该模型将产生三个状态空间变量:价格Pt、第一存储Itan库存和第二存储It库存。每个存储设施都是独立控制和操作的(因此有9种可能的模式mt∈ {-1, 0, 1} × {-1, 0, 1}.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-9 21:16:10
此外,这两个设施具有相同的坡度特性,每个都符合第6.1节的要求;因此,两个这样的洞穴的总价值只是单个洞穴价值的两倍。总体而言,该设置的实施与2D(highlightingscalability)中的设置直接平行,但我们强调了两个变化:(i)对于空间填充设计,我们切换到3DSobol序列;虽然我们没有观察到LHS和Sobol序列在2D问题上的性能有任何显著差异,但在3D LHS中,稳定性较低(运行期间的^V(0、6、1000、1000)变化较大),产量估计比Sobol设计差约8万至10万美元;(ii)对于混合重量,我们采用空间填充和经验分布的50%/50%的场地,即D=P(0.5N)∪ S(0.5N)。这两种修改的原因是,与之前的示例相比,单位体积设计场地的数量较低,即预算较低。充分的空间——需要通过QMC设计实现,以探索相关的输入空间,并充分了解3D延拓函数的形状。在图8中,我们展示了PR-3D和GP-3D对于混合和空间填充设计的性能。为了便于比较,我们报告了两个设施总价值的一半,这应该与表2中的原始值完全匹配。毫不奇怪,3D问题更难解决,因此对于相同的模拟预算,报告的估值更低。例如,在10budget下,AdaptiveGP-3D的估值比GP-2D混合物低25.1万美元;当我们将模拟预算增加到N=10时,这一缺口将下降到10.9万美元。此外,即使使用多项式回归(Sobol PR与MixturePR),混合和空间填充设计的性能之间的差异也很明显。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-9 21:16:14
GP-3D混合料设计进一步提高了估价;我们观察到,在N=10预算的情况下,混合PR和混合GP的差异超过30万美元。Sobol PR-3D混合物PR-3D混合物GP-3D430044004500460047004800490050005100评估10k40K67K100K图8:第6.5节中两个储槽3D示例的估计值^V(0,6,1000,1000)/2的一半。结果是在4个不同的模拟预算中对每个算法进行10次运行∈ {10K、40K、67K、100K}。箱线图的描述与图6.7随机净需求下的微电网平衡相同。在本例中,我们在微电网的背景下使用第2节的框架,微电网是由可再生能源、柴油发电机和储能电池组成的电网的缩小版本。微电网可以隔离或连接到国家电网,目标是通过高效利用柴油发电机和电池,以满足可再生能源间歇发电的需求,以最低成本供电。此处所考虑的微电网拓扑与[2]中的拓扑相似,如图9所示。图9:微电网拓扑外部因素对应于剩余需求Xtk=Ltk- Rtk,其中Ltk、Rtk分别表示可再生能源的需求和产出。我们假设microgridcontroller仅将其策略基于X,建模为离散的Ornstein-Uhlenbeck过程:Xtk+1- Xtk=α(X- Xtk)t+σWtk,Wtk公司~ N(0,t) 。(27)在电源侧,控制器有两种资源:电池(储能)和柴油发电机。电池的状态由其表示∈ [0,Imax],动力学由Itk+1=Itk+a(ctk)给出t=Itk+Btkt、 (28)其中a(ctk)被解释为电池输出,由ctk驱动柴油输出。后者有两种制度mtk∈ {0, 1}. 在关闭状态下,mtk+1=0,ctk(0)=0。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-9 21:16:17
当柴油机开启时,mtk+1=1,其功率输出取决于状态,由:ctk(1)=Xtk{Xtk>0}+Bmax给出∧Imax公司- Itk公司t、 (29)其中Bmax>0是蓄电池的最大功率输入。电池的功率输出是剩余需求和柴油输出之间的差异,前提是它保持在电池的物理容量限制[0,Imax]内:Btk:=a(ctk)=-Itk公司t型∨最小宽度∨ (ctk- Xtk)∧B最大值∧Imax公司- Itk公司t、 (30)为了描述成本结构,定义不平衡过程St=S(ct,Xt):Stk=ctk- Xtk公司- Btk。(31)通常不平衡为零,即电池吸收生产和需求之间的差异。Stk<0表示电源不足,导致停电;Stk>0会导致疾病或能源浪费。我们不对称地惩罚这两种情况,使用C1、2故障和停电的成本,取C Cin目标零停电顺序:π(c,X):=-cγ- |S | hC{S<0}+C{S>0}i.(32)关于这种函数形式选择的更多讨论可以在[20,2]中找到。此外,关闭时启动柴油发电机会产生切换成本K(0,1)=10,但不会产生切换柴油发电机的成本,K(1,0)=0。最终的优化问题是从状态(Xtk、Itk、mtk)开始,观察剩余需求过程Xtk,以最大化遵循政策mtk的路径价值,正如(6)中所述。7.1最佳微电网控制我们使用的参数如表4所示。对于终端条件,我们再次强制控制器返回微电网,至少初始电池电量:W(XT,IT)=-最大200(I- IT,0)。与第6节中的储气问题相比,这种处罚的效果有所不同。因为控制器只能部分控制库存,所以我们最终得到了^IT∈ [I,Imax]。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-9 21:16:20
我们使用N=10000的模拟预算和N=200000的样本外预算。为了实现的简单性,我们在两个m区域中使用相同的模拟设计(即Dkisindependent of m,参见算法1)。α=0.5,X=0,σ=2Imax=10(kWh),Bmin=-6,Bmax=6(kW),K(0,1)=10,K(1,0)=0C=5,C=10,γ=0.9,T=48(小时),t=0.25(小时)表4:第7节中微电网的参数。图10a说明了微电网控制器针对给定pathof剩余需求(Xt)的计算策略(^mt)。左面板绘制需求X0:T(左y轴)、库存^I0:T和柴油输出c0:T(两个右y轴)的联合轨迹。柴油通常是有效的;只要剩余需求量很大,或库存接近空置,控制员就会启动柴油发电机。当发电机接通时,电池按照(29)快速重新充电;否则,^I趋于减小,除非Xtk<0。图的中间和右侧面板显示了结果策略c(t,X,I,m)=c(^m(t,X,I,m))。由于切换成本的影响,当发电机打开时(图10c),与关闭时相比,它继续保持在更大的状态空间区域内。0 0.5 1 1.5 2时间(天)-6-4-202468剩余需求0246810214库存/柴油动力剩余需求VentoryDiesel Power(a)路径轨迹(b)发电机关闭(m=0)(c)发电机打开(m=1)图10:左面板:剩余需求轨迹(Xt),对应于策略(ct)和生成的库存轨迹(^It)。中间和右侧面板:控制策略^c(t,X,I,m)att=24小时。回想一下,当柴油机关闭时,c(0)=0。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-9 21:16:23
所有面板均基于GP-2D回归和混合料设计D=P(0.5N)∪ L(0.5N)。7.2数值结果图11显示了N=10000时,不同设计和回归方法下微电网的估计值^V(0,0,5,1)。回想一下,在此设置中,控制器只会产生成本,因此^V<0和更小(成本)更好。方案的相对性能与第6节相似。在回归方法中,我们继续观察到填充空间设计的性能较低。然而,与传统回归方法相比,GP对这种设计变更更为稳健。此外,GPR显著改进了PR-2D(其性能非常差,如图11所示)。GP-2D的自适应设计再次产生了最高的估值(最低的成本),并在PR-1D的基础上大幅改进。8结论和未来工作开发的DEA模板概括了随机存储问题RMC方法领域中使用的现有方法。DEA的模块化允许进行广泛的修改,以增强当前的技术水平并提高可扩展性。特别是,我们展示了几种近似空间和模拟设计的组合,它们与文献中报道的任何基准测试(使用-1D和-2D方法)一样好或更好。强调实验设计方面,我们表明,通过消除模拟全局路径的需要,在消除传统RMC的内存需求方面有很大的自由度。类似地,像GPR这样的非参数回归方法可以最大限度地减少选择“正确”基函数的担忧。此外,我们强调混合和匹配不同方法的可能性。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-9 21:16:26
例如,我们举例说明了使用不同的设计、回归和跨时间步的预算对储气设施进行基于EA的评估。PR-1D GP-1D GP-2D-145.5-145-144.5-144-143.5评估常规空间填充混合图11:微网格示例和不同设计回归对的估计值^V(0,0,5,1)。结果是每个算法运行10次。相比之下,PR-2D估计平均估值在-153.6, -156.4, -152.3分别适用于传统、空间填充和混合设计。箱线图的描述与图6中的描述相同。自然延伸是考虑注射/退出速率连续的设置。在这种情况下,必须在ct上进行优化,将arg max操作符替换为允许控制集c上的boni fied arg sup∈ A、 根据切换成本的评估方式,可以完全消除模式mt,或者进行双重优化v(t,Pt,It,mt)=maxm∈Jnsupc公司∈A(Pt,It,m)π(Pt,c)t+q(t,Pt,It+t(c),m)- K(mt,m)o。这可以解释为求解一个无bang-bang开关模型,当proπ和c之间存在某种非线性联系,或者c对其产生非线性影响时,就会出现这种模型+t、 在c上进行内部优化需要联合回归方案,以使^q(t,·)在其中光滑+t、 我们的模板提供的另一个方向是使用备注2来生成路径延续值,从而转向前瞻性策略。通过w>1,可以在西西里斯·范罗伊方法和朗斯塔夫·施瓦茨方法之间进行插值,理想情况下,可以通过数据驱动的方案,在每个时间步自适应地选择前瞻。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-9 21:16:29
为此,GP回归结果可用于量化^q(tk,·)中的单步投影误差。在不同的情况下,可以考虑对(Pt)和(It)之间的自主/内源性二分法模糊的地方进行修改。例如,在水力发电运行的情况下,会出现一种不同的蓄水问题,即控制从上游接收水流并可向下游放水的双坝水库【1,10】。此外,无论运行情况如何,水库都会经历蒸发和/或自然水位下降。在此设置中,InventoryExperience会经历随机冲击,无论是由于随机流入(由于降水)还是随机流出(由于基于温度的蒸发等)。因此,它是It、ct和某些外部噪声(或因素)Ot的函数。此外,如果大坝较大,水电管理具有内生随机风险,即控制ctkalso通过修改区域能源供应影响价格过程Ptk+1的分布,从而影响驱动(Pt)变化的供需平衡。参考文献【1】Alais,J.C.、Carpentier,P.、De Lara,M.:多用途水电站单坝管理:机会约束优化和随机生存能力。能源系统8(1),7–30(2017)【2】Alasseur,C.,Balata,A.,Ben Aziza,S.,Maheshwari,A.,Tankov,P.,Warin,X.:微电网管理的回归蒙特卡罗。《技术代表》,arXiv 1802.10352(2018)【3】Balata,A.,Palczewski,J.:《马尔可夫过程最优控制的后回归蒙特卡罗》。ArXiv e-prints(2017)[4]Balata,A.,Palczewski,J.:《能源应用中最优库存控制的后回归蒙特卡罗》。《技术代表》,arXiv 1703.06461(2017)[5]B¨auerle,N.,Riess,V.:《采用制度转换的储气库估价》。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-9 21:16:32
能源系统7(3),499–528(2016)[6]Binois,M.,Gramacy,R.B.,Ludkovski,M.:大型模拟实验的实用异方差高斯过程建模。《计算和图形统计杂志》(toappear)(2018)[7]Boogert,A.,de Jong,C.:使用蒙特卡罗方法进行天然气储量评估。《衍生杂志》第81–98页(2008)[8]Boogert,A.,de Jong,C.:使用多因素价格过程的天然气储量估价。《能源市场杂志》4,29–52(2011)【9】Bouchard,B.,Warin,X.:《美国期权的蒙特卡罗估值:事实和改进现有方法的新算法》。摘自:R.A.Carmona,P.Del Moral,P.Hu,N.Oudjane(编辑),《金融中的数值方法:波尔多》,2010年6月,第215-255页。Springer BerlinHeidelberg,Berlin,Heidelberg(2012)[10]Carmona,R.,Ludkovski,M.:《储能评估:最佳切换方法》。《定量金融》10(4),359–374(2010)【11】Chen,Z.,Forsyth,P.A.:天然气储量估值和优化运行的半拉格朗日方法。《暹罗科学计算杂志》30(1),339–368(2008)【12】Cong,F.,Oosterlee,c.:基于蒙特卡罗模拟的多期均值方差投资组合优化。《经济动力学与控制杂志》64,23–38(2016)[13]戴维森,M.,赵,G.:双坝水电站的最优控制。系统工程Procedia 3,1–12(2012)【14】Denault,M.,Simonato,J.G.,Stentoft,L.:具有内生状态变量的随机动态程序的模拟和回归方法。计算机与运筹学40(11),2760–2769(2013)[15]Eglo Off,D.:用于最佳停止和统计学习的蒙特卡罗算法。《应用概率年鉴》15(2),1396–1432(2005)【16】Egloff,D.,Kohler,M.,Todorovic,N.:百慕大期权定价的动态前瞻蒙特卡罗算法。安。应用程序。概率。17(4), 1138–1171 (2007).
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-9 21:16:36
DOI 10.1214/105051607000000249。统一资源定位地址https://doi.org/10.1214/105051607000000249[17] Felix,B.J.,Weber,C.:应用数字构造的重组树进行储气库估价。《欧洲运筹学杂志》216(1),178–187(2012)【18】Gramacy,R.B.,Ludkovski,M.:最优停车问题的顺序设计。《暹罗金融数学杂志》6(1),748–775(2015)[19]Han,J.,E,W.:随机控制问题的深度学习近似。技术代表,arXiv 1611.07422(2016)【20】Heymann,B.、Bonnans,J.F.、Martinon,P.、Silva,F.J.、Lanas,F.、Jim'enez Est'evez,G.:微电网能源管理的连续最优控制方法。能源系统9(1),59–77(2018)【21】Heymann,B.,Bonnans,J.F.,Silva,F.,Jimenez,G.:一种用于微电网能源管理的随机连续时间模型。2016年欧洲控制会议(ECC),第2084–2089页(2016)[22]Heymann,B.,Martinon,P.,Bonnans,F.:长期老化:自适应权重动态编程算法。工作文件或预印本(2016年)【23】Jain,S.,Oosterlee,C.W.:使用随机网格法为高维百慕大期权定价。《国际计算机数学杂志》89(9),1186–1211(2012)【24】Jain,S.,Oosterlee,C.W.:《随机网格捆绑法:百慕大期权及其希腊期权的有效定价》。《应用数学与计算》269412–431(2015)[25]Kharroubi,I.,Langren\'e,N.,Pham,H.:完全非线性HJB方程的数值算法:控制随机化方法。蒙特卡罗方法。和应用程序。20、145–165(2014)【26】Langren\'e,N.,Tarnopolskaya,T.,Chen,W.,Zhu,Z.,Cooksey,M.:矿产行业高维实物期权问题的新回归蒙特卡洛方法。第21届国际建模与仿真大会,pp。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-9 21:16:39
1077–1083(2015)[27]Longstaff,F.A.,Schwartz,E.S.:《通过模拟评估美式期权:一种简单的租赁方方法》。金融研究综述14(1),113–147(2001)[28]Ludkovski,M.:百慕大期权定价的克里格元模型和实验设计。《计算金融杂志》(即将出版,arXiv 1509.02179)(2015)【29】Malysche Off,A.M.,Trafalis,T.B.:通过最小二乘蒙特卡罗和支持向量回归进行天然气储量评估。能源系统(即将出版)(2017)[30]Mazieres,D.,Boogert,A.:天然气储量估值的径向基函数方法。《能源市场杂志》6,19–50(2013)【31】Nadarajah,S.,Margot,F.,Secomandi,N.:最小二乘蒙特卡罗方法与能源实物期权应用的比较。《欧洲运筹学杂志》256(1),196–204(2017)【32】Pham,H.:最优切换和自由边界问题。《金融应用中的连续时间随机控制与优化》,第95-137页。施普林格,柏林,海德堡(2009)【33】汤普森,M.:天然气储量评估、优化、市场和信用风险管理。《商品市场杂志》2(1),26–44(2016)【34】Thompson,M.、Davidson,M.、Rasmussen,H.:《天然气储量估值与优化:实物期权应用》。海军研究后勤部(NRL)56(3),226–238(2009)【35】Tsitsiklis,J.N.,Van Roy,B.:复杂美式期权定价的回归方法。变速箱。神经。网络。12(4),694–703(2001)[36]Van Ackooij,W.,Warin,X.:关于随机对偶动态规划的条件割。技术代表,arXiv 1704.06205(2017)[37]Warin,X.:储气对冲。摘自:R.A.Carmona,P.Del Moral,P.Hu,N.Oudjane(编辑),《金融中的数值方法:波尔多》,2010年6月,第421-445页。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-9 21:16:42
Springer,Berlin,Heidelberg(2012)[38]Zhao,G.,Davidson,M.:《含抽水蓄能的水力发电设施的最优控制》。可再生能源34(4),1064–1077(2009)A设计规范设计回归低-中-高常规PR-1D/-2D(NP×NI)1050×102100×20 3400×30GP-1D/-2D,黄土(Ns×Nb×NI)105×10×10 210×10×20 340×10×30空间-LLIGPR-1D(NP×NI)1050×10 2100×20 3400×30GP-1D(Ns×Nb×NI)105×10×10 210×10×20 340×10×30PR-2D(N)10500 42000 102000黄土/GP-2D(Ns×Nb)500×21 1000×42 2000×51自适应-1DPR-1D(NP×NI)950×11 2000×21 3300×31GP-1D(Ns×Nb×NI)95×10×11 200×10×10 21 330×10×31混合料-2DPR-2D(N)10500 42000 102000黄土/GP-2D(Ns×Nb)500×21 1000×42 2000×51动态CGP-1D(N(2))150×10×21 340×10×31 440×10×41(N(1))74×10×11 168×10×21 300×10×31PR-1D+GP-2D(N(2))2000×21 3400×31 4400×41(N(1))500×21 1000×42 2000×51表5:第6.1节表2不同方法的设计施工。NISpecification11[0:100:200,500:250:1500,1800:100:2000]21[0:50:200,400:200:800,900:50:1100,1200:200:1600,1800:50:2000]31[0:25:100,150,200:100:900,950:50:1050,1100:100:1800,1850,1900:25:2000]其他统一空格表6:表2中用于自适应设计的离散化库存水平。设计回归10k 40k 67k 100K OBOL/AdaptivePR-2D(N)10500 42000 67500 102000GP-2D(Ns×Nb)500×21 1000×42 1500×45 2000×51表7:图8第6.5节不同3D方法的设计规范。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群