全部版块 我的主页
论坛 经济学人 二区 外文文献专区
982 31
2022-05-09
英文标题:
《Weakly chained matrices, policy iteration, and impulse control》
---
作者:
Parsiad Azimzadeh, Peter A. Forsyth
---
最新提交年份:
2017
---
英文摘要:
  This work is motivated by numerical solutions to Hamilton-Jacobi-Bellman quasi-variational inequalities (HJBQVIs) associated with combined stochastic and impulse control problems. In particular, we consider (i) direct control, (ii) penalized, and (iii) semi-Lagrangian discretization schemes applied to the HJBQVI problem. Scheme (i) takes the form of a Bellman problem involving an operator which is not necessarily contractive. We consider the well-posedness of the Bellman problem and give sufficient conditions for convergence of the corresponding policy iteration. To do so, we use weakly chained diagonally dominant matrices, which give a graph-theoretic characterization of weakly diagonally dominant M-matrices. We compare schemes (i)--(iii) under the following examples: (a) optimal control of the exchange rate, (b) optimal consumption with fixed and proportional transaction costs, and (c) pricing guaranteed minimum withdrawal benefits in variable annuities. We find that one should abstain from using scheme (i).
---
中文摘要:
这项工作的动力来自于与组合随机和脉冲控制问题相关的Hamilton-Jacobi-Bellman拟变分不等式(HJBKVIS)的数值解。特别地,我们考虑(i)直接控制,(ii)惩罚,以及(iii)应用于HJBKVI问题的半拉格朗日离散化方案。方案(i)采用了一个贝尔曼问题的形式,涉及一个不一定是收缩的算子。我们考虑了Bellman问题的适定性,并给出了相应策略迭代收敛的充分条件。为此,我们使用弱链对角占优矩阵,它给出了弱对角占优M-矩阵的图论特征。我们比较了方案(i)——(iii)在以下示例下:(a)汇率的最优控制,(b)具有固定和比例交易成本的最优消费,以及(c)可变年金中有保证的最低提款利益的定价。我们发现应该避免使用方案(i)。
---
分类信息:

一级分类:Mathematics        数学
二级分类:Numerical Analysis        数值分析
分类描述:Numerical algorithms for problems in analysis and algebra, scientific computation
分析和代数问题的数值算法,科学计算
--
一级分类:Quantitative Finance        数量金融学
二级分类:Computational Finance        计算金融学
分类描述:Computational methods, including Monte Carlo, PDE, lattice and other numerical methods with applications to financial modeling
计算方法,包括蒙特卡罗,偏微分方程,格子和其他数值方法,并应用于金融建模
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-5-9 07:22:23
弱链矩阵、策略迭代和脉冲控制。阿齐姆扎德*P.A.福赛斯*与组合随机和脉冲控制问题有关的变分不等式(HJBKVIS)。特别地,我们考虑(i)直接控制,(ii)惩罚,以及(iii)应用于HJBKVI问题的半拉格朗日离散化方案。方案(i)的形式是一个涉及操作员的行李员问题,该操作员不需要控制。我们考虑Bellman问题的适定性,并给出相应策略迭代收敛的充分条件。为此,我们使用弱链对角占优矩阵,它给出了弱对角占优M-矩阵的图论特征。我们在以下示例下比较了方案(i)-(iii):(a)汇率的最优控制,(b)具有固定和比例交易成本的最优消费,以及(c)在可变年金中定价保证的最低提款收益。我们发现应该避免使用方案(i)。关键词。Hamilton-Jacobi-Bellman方程,组合随机和脉冲控制,政策迭代,弱链对角占优矩阵,最优汇率,最优消费,GMWBAMS主题分类。65N06,93E201简介这项工作的动机是计算与组合随机和脉冲控制相关的Hamilton-Jacobi-Bellman拟变分不等式(HJBQVI)的数值解。这些问题的形式是:问题。找到HJBQVI0=F(t,x,u,Du(t,x),Du(t,x))的粘度溶液(见[17,定义2.2]):-maxsupw∈W(U吴天宇- ρu+fw),μ- U在[0,T)×上(Ohm \\ ∧最大值(g)- u、 穆- u) 在+Ohm(1.1)*大卫·R。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 07:22:26
加拿大滑铁卢滑铁卢大学切里顿计算机科学学院N2L3G1pazimzad@uwaterloo.ca和paforsyt@uwaterloo.caarXiv:1510.03928v4[math.NA]2017年9月24日在哪里Ohm 开放∧ Ohm,+Ohm:= ([0,T)×λ)∪({T}×)Ohm),Lw:=L(t,x,w)是SDE的(可能退化的)发生器,fw:=f(t,x,w)是强迫项,而MIS脉冲(又称干涉)运算符mu(t,x):=supz∈Z(t,x){u(t,x+Γ(t,x,Z))+K(t,x,Z)}。(1.2)如果z(t,x)在特定点(t,x)为空,则μ(t,x)被理解为取该值-∞,对应于此时不允许有脉冲。我们主要研究HJBKVI问题的隐式离散化格式,这些格式不受显式格式通常的时间步长限制。特别地,我们考虑(i)直接控制,(ii)惩罚和(iii)半拉格朗日方案。半拉格朗日方案(用于[]中的HJBQVIs)与对应方案不同,它使用前一时间步的信息处理受控项。因此,仅在一阶项的系数内计算该模式的解。对于其他两种方案,需要迭代方法。本文分析的特定迭代方法是Howard’s,其性能较差,因为数值网格被重新定义[,§6.1]。应用于惩罚方案的策略迭代的收敛性证明是输入矩阵对策略迭代严格对角占优的一个微不足道的结果(5.2)。如下文所述,应用于直接控制方案的迭代收敛性是一个更微妙的问题。直接控制方案采用定点问题find v的形式∈ 使v=maxsupw∈WL(w)v+c(w),supz∈ZB(z)v+k(z)!(1.3)其中L(w)和B(z)分别是收缩矩阵和非扩张矩阵。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 07:22:31
可以理解,上确界和最大值是基于元素的,控件是“行解耦的”(参见§2)。(1.3)2(iii)]。我们消除了这个限制。更重要的是,[]限制了可接受的控制集,并对B(z)(本研究中的假设(H2)是类似的)施加了一个强假设,以确保应用于(1.3)的策略迭代的重新收敛。不幸的是,问题(1.3)的合理实例(包括本工作中的示例)不一定满足此条件。我们证明,在较弱的假设下,(1.3)的解是唯一的。此外,当(H2)不能直接满足时,我们提供了一种通过考虑满足(H2)的“修正问题”来构造此解决方案的方法。粗略地说,我们通过从控制集中删除一些次优的控制来解决修改后的问题。然而,该程序是临时的(即,取决于问题)。矩阵。WCDD矩阵给出了弱对角占优M-矩阵的图论特征(定理3.5)。应用于(1.3)的政策迭代收敛的WCDD矩阵方法是直观的,并使用政策迭代(命题2.2)的著名结果建立。因此,人们自然会问,使用直接控制方案是否有好处。为了回答这个问题,我们将每个方案应用于以下示例:o汇率的最佳控制;o具有固定和比例交易成本的最优消费在可变年金中定价保证最低提款收益。由于不需要迭代方法,半拉格朗日格式每一时间步只需要一个线性解。然而,如上所述,如果控制出现在Lw的扩散系数中(或者如果基础过程是具有控制到达率的Lévy),则不能使用这种方案。我们发现,惩罚方案的表现至少与直接控制方案一样好。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 07:22:35
两者产生几乎相同的结果,并且通常需要与直接控制方案大致相同数量的EVEN,每个时间步只需几次策略迭代即可收敛。我们提到,在有限的地平线设置中(T=∞), 在[]中,使用迭代最优停止法(一种理论工具[,第7章,引理7.1]来构建解决方案,并将其应用于数值实现[,]中,以数值方式考虑了具有超额和比例交易成本的最优消费。计算上,对于有限的地平线∞微分方程[18],一种最近的替代方法,非常适合高维问题。在这项工作中,我们将注意力限制在三维或更低维度的问题上。为了继续关注脉冲控制的有趣方面,我们假设脉冲之间的u:ut,x,wσ:σt,x,战争速率为[13])。这允许我们写Lwu(t,x):=traceσ(t,x,w)σ|(t,x,w)Dxu(t,x)+ hu(t,x,w),Dxu(t,x)i。我们在这里提到的问题(1.3)也可以解释为行李员问题4。2(1.3)库什纳和杜普伊斯的专著(第39-40页)。在MDP的背景下,L(w)和B(z)分别捕获了折扣因子为非零和为零的状态下的跃迁概率。WCDD矩阵条件保证了4的收敛性。4该条件确保基础马尔可夫链(以正概率)到达ata状态,且不依赖于初始状态的非方差折扣。我们总结了以下一些主要发现:o矩阵迭代的可能奇异性。o我们建立了可证明收敛的技术来消除奇异性。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 07:22:40
然而,应用这些技术取决于问题我们证明了应用于(单调)惩罚方案的策略迭代永远不会失败。对三个问题进行的数值试验证实,这种方案的性能至少与直接控制方案一样好(有时甚至更好)。为确保直接控制方案中的一致性,以及惩罚方案中的可比(如果不是更好的话)表现,需要额外的努力,这表明人们应该放弃直接控制方案。政策迭代的收敛性。§讨论WCDD矩阵。§给出了(1.3)假设的条件。其中给出了一个独立的MDP示例(示例4.2)。§介绍HJBQVI问题(1.1)的数值格式,以及后续§6.2政策迭代中给出的数值示例,我们将看到(1.1)的每个离散化格式都采用aBellman问题的形式:find v∈ 例如,支持∈P{-A(P)v+b(P)}=0(2.1),其中:P→ RM×Mandb:P→ RM。据了解,(i)P:=QMi=1Piis是非空集的唯一产物,(ii)控件是行解耦的:[a(P)]ij和[b(P)]i仅依赖于Pi∈ Pi,(iii)RM(分别为RM×M)上的顺序是元素级的:对于x,y∈ RM,x≥ y当且仅当xi≥ 对于所有i,和(iv)上确界由以下顺序诱导:{x(P)}P∈P 供应室∈Px(P)是一个包含分量supP的向量∈P[x(P)]i.LetSolve(A,b,x)表示通过初始猜测x调用线性解算器forAx=b(代数上,解算精确;实际上,使用迭代解算器,选择解算器会影响性能)。策略迭代算法由以下公式给出:“=1,2,…”的策略迭代(P,A(·),b(·),v)1。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群