全部版块 我的主页
论坛 经济学人 二区 外文文献专区
1114 33
2022-06-10
英文标题:
《Dynamic programming for optimal stopping via pseudo-regression》
---
作者:
Christian Bayer, Martin Redmann, John Schoenmakers
---
最新提交年份:
2019
---
英文摘要:
  We introduce new variants of classical regression-based algorithms for optimal stopping problems based on computation of regression coefficients by Monte Carlo approximation of the corresponding $L^2$ inner products instead of the least-squares error functional. Coupled with new proposals for simulation of the underlying samples, we call the approach \"pseudo regression\". A detailed convergence analysis is provided and it is shown that the approach asymptotically leads to less computational cost for a pre-specified error tolerance, hence to lower complexity. The method is justified by numerical examples.
---
中文摘要:
我们引入了基于回归的经典算法的新变体,该算法基于通过相应的$L^2$内积的蒙特卡罗近似计算回归系数,而不是最小二乘误差函数。再加上模拟潜在样本的新建议,我们称这种方法为“伪回归”。文中给出了详细的收敛性分析,结果表明,对于预先指定的误差容限,该方法渐进地减少了计算量,从而降低了复杂性。数值算例验证了该方法的正确性。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Computational Finance        计算金融学
分类描述:Computational methods, including Monte Carlo, PDE, lattice and other numerical methods with applications to financial modeling
计算方法,包括蒙特卡罗,偏微分方程,格子和其他数值方法,并应用于金融建模
--
一级分类:Mathematics        数学
二级分类:Probability        概率
分类描述:Theory and applications of probability and stochastic processes: e.g. central limit theorems, large deviations, stochastic differential equations, models from statistical mechanics, queuing theory
概率论与随机过程的理论与应用:例如中心极限定理,大偏差,随机微分方程,统计力学模型,排队论
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-6-10 10:41:58
通过伪回归实现最优停车的动态规划Christian BAYER,MARTIN REDMANN,JOHN SCHOENMAKERSAbstract。我们引入了基于回归的经典算法的新变体,该算法基于通过相应Linner乘积的蒙特卡罗近似计算回归系数,而不是最小二乘误差函数。再加上模拟潜在样本的新建议,我们称这种方法为“伪回归”。提供了详细的收敛性分析,结果表明,该方法渐进地减少了预先指定的容错的计算成本,从而降低了复杂性。该方法通过数字样本进行了验证。引言随机最优停止问题(离散时间)在随机最优控制的理论和数值文献中都起着重要作用,因为它们通常被认为很难解决,并且有许多实际应用,特别是在能源和金融领域(美国或百慕大选择自然可以理解为随机最优停止问题)。已经提出了许多数值方法,从PDE技术(基于相关连续时间问题的Hamilton-Jacobi-Bellman方程)到基于蒙特卡罗(模拟)的方法,涉及回归技术、策略迭代、对偶等。有关概述,请参见示例[6]、[5]。在本文中,我们考虑基于Bellman方程的随机方法。经典算法(如Longstaff和Schwartz【8】或Tsitsiklis和Van Roy【10】提出的算法)的一个关键组成部分是(全局)回归,用于计算一些随机变量Y和z的条件期望,例如u(z):=E【Y | z=z】。给定基函数ψ。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-10 10:42:03
,ψK,因此,我们在线性跨度{ψ,…,ψK}中寻找未知函数u关于u表示的Z分布的最佳近似,即,我们理想地想要解决最小化问题β*:= arg最小值β∈RKE公司Y-KXk=1βkψk(Z),为了找到近似值u(·)≈PKk=1β*kψk(·)=:uK(·)。经典地,基于期望的蒙特卡罗近似,将上述最小化问题直接转化为相应的最小二乘问题,即对于2 CHRISTIAN BAYER、MARTIN REDMANN、JOHN SCHOENMAKERSi。i、 d.样品(Yi,Zi),i=1,M、 求解(1.1)bβ:=arg minβ∈RKMXi=1易-KXk=1βkψk(Zi).虽然现在已经很好地理解了,但值得一提的是,对bβ作为M的收敛性的分析→ ∞ 由于对随机矩阵理论的依赖,它不是微不足道的,例如参见[7]。除了通过蒙特卡罗模拟近似最小化问题,还可以直接近似解β*.实际上,请注意,uKis当然是u到L(u)意义上的跨度{ψ,…,ψK}的线性投影。因此,为了便于记法,假设基函数ψ,ψKare正交w.r.t.u-一般情况下需要与由hψk,ψliL(u)形成的Gram矩阵相乘-我们有β*k=hu,ψkiL(u)=E[E[Y | Z]ψk(Z)]=E[Yψk(Z)]。然而,该公式可以通过蒙特卡罗模拟立即近似,给出(1.2)βk:=MMXi=1Yiψk(Zi),k=1,K、 从技术的角度来看,β的收敛性分析相对简单,并导致orderKM的平方误差项(见定理4.1)。另一方面,由最小二乘问题的解Bβ引起的平方误差为(1+lnm)KM(见定理4.2)。同时,与计算Bβ相比,计算β也更精确,因为我们避免计算线性方程组(见第5节的讨论)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-10 10:42:07
然而,正如我们在后面的第3.1节中所看到的,β的计算确实依赖于与基函数和度量u相关的Gram矩阵的知识。基于回归的算法的另一个重要细节,尤其是在需要连续回归步骤时,是随机变量(Y,Z)的选择。显然,回归过程的结果(就像条件期望一样)只取决于给定Z的Y的条件分布,而不取决于Z本身的分布,这给了我们很大的自由度。在百慕大期权的上下文中,让Xjdenote在时间j处表示基本过程(更多详细信息,请参见第2节),让vjdenote在时间j处表示期权值。然后,在动态编程的最简单情况下,我们需要评估条件期望E[vj(Xj)| Xj-1=z]。因此,上述回归过程的非常自然的实现将基于整个部门的M个样本(Xi,…,XiJ),直到选项的到期时间J,迭代使用切片Yi≡ vj(Xij)和Xi≡ Xij公司-1在上述符号中,对于j=1,J、 因此,X的分布u将取决于J。另一种方法,当Xjis是均匀马尔可夫过程时,尤其有利,即当Xj的条件分布为Xj时-1=z不依赖于j,而是为所有j确定一个(精心选择的)概率度量u。现在从u和XI中的r.v.s UIxjgivenxj的条件分布中取样-1=Ui。因此,我们得到[vj(X)| U=z]=E[vj(Xj)| Xj-1=z],动态。OPT编程。通过伪回归3停止,我们可以对j=1,…,的每个连续回归步骤使用同一批样本,J、 大大减少了算法的计算时间。作为一个额外的好处,我们现在可以自由选择概率度量u。这使我们能够具体选择u和基函数ψ。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-10 10:42:11
,ψKsuch表示基函数已经是正交的w.r.t.u,这意味着一个平凡的Gram矩阵。在下文中,我们将使用一组固定的采样轨迹组合称为Xi,XIJ使用最小二乘估计量(1.1)标准回归,我们将基于任意选择的度量u的样本组合(Ui,Xi)与L投影估计量(1.2)伪回归称为组合。我们认为,对于许多百慕大期权问题,与标准回归相比,伪回归在理论和数值上都具有优势。实际上,样本数M的收敛速度→ ∞ 由于缺少ln(M)项(见定理4.1和4.2)更好所需浮点数的渐近值较小(见第5节)数值示例表明,固定误差容限的计算成本较低,与理论相符,见第6节。最后但并非最不重要的一点是,我们提供了一个详细的分析,得出了Tsitsiklis–van Roy和Longstaff–Schwartz算法的伪回归版本的显式收敛速度。论文大纲。在第2节中,我们总结了离散时间最优停止的一些理论,并回顾了(经典的)Tsitsiklis–van Roy和Longsta off–Schwartz算法。在第3节中,我们详细描述了标准回归和伪回归涉及的一步回归程序。在第4节中,我们陈述了伪回归方法的一般收敛结果(定理4.1),Longsta off–Schwartz伪回归版本的收敛结果(定理4.5),以及Sitsiklis–van Roy伪回归版本的类似收敛结果(定理4.7)。我们在第5节中讨论了不同算法变体的计算成本,并在第6节中给出了数值示例。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-10 10:42:15
在第7节中,我们总结并概述了未来的研究。更多的技术证明推迟到附录部分。2、离散时间最优停车概述2.1。离散时间最优停止理论。让我们回顾一下关于离散时间最优停止问题的一些事实。假设(Zj:j=0,1,…,j)是过滤概率空间上离散时间的非负自适应随机过程(Ohm, Fj,0≤ j≤ J、 P),满足jxj=1E【Zj】<∞.在(离散时间)的情况下,美国或百慕大期权Z可被视为(贴现)现金流流程,可由期权持有人一次性行使。更具体地说,人们可能认为P是对应于某个数字N(为简单起见,N=1)和Z=R/N的定价度量,其中(Rj:j=0,1,…,j)是一个真实的(未贴现的)现金流过程。然后,根据CHRISTIAN BAYER、MARTIN REDMANN、JOHN SCHOENMAKERSno套利原则,众所周知,美式期权的公平价格为(2.1)Y:=supτ∈SE[Zτ],其中sde注意到F-停止时间集取{0,…,J}中的值。Z的Snellenvelope定义为(2.2)Yj:=ess supτ∈SjEFj【Zτ】,j=0。。。,J、 其中sj表示取{J,…,J}值的F-停止时间集。我们重新调用了以下经典事实(例如,见[9]):(1)Z的斯内尔包络Y是支配Z的最小超鞅。它可以通过反向动态编程原理或Bellman原理递归构造:YJ=ZJ(2.3)YJ=maxZj、EFj【Yj+1】, 0≤ j<j.(2)(2.1)的最佳停车时间由τ给出*= 最小值{j:0≤ j≤ J、 Zj公司≥ EFj[Yj+1]]},Yj+1:=0。也就是说,Y=supτ∈SE[Zτ]=E[Zτ*] .因此,原则上,通过从j=j向后执行(2.3)到j=0,可以得出(2.1)的解。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群