全部版块 我的主页
论坛 经济学人 二区 外文文献专区
1044 35
2022-05-06
英文标题:
《Impulse Control of a Diffusion with a Change Point》
---
作者:
Lokman A. Abbas-Turki, Ioannis Karatzas and Qinghua Li
---
最新提交年份:
2014
---
英文摘要:
  This paper solves a Bayes sequential impulse control problem for a diffusion, whose drift has an unobservable parameter with a change point. The partially-observed problem is reformulated into one with full observations, via a change of probability measure which removes the drift. The optimal impulse controls can be expressed in terms of the solutions and the current values of a Markov process adapted to the observation filtration. We shall illustrate the application of our results using the Longstaff-Schwartz algorithm for multiple optimal stopping times in a geometric Brownian motion stock price model with drift uncertainty.
---
中文摘要:
本文解决了一个扩散问题的Bayes序贯脉冲控制问题,该扩散的漂移具有一个不可观测的参数和一个变化点。通过改变消除漂移的概率测度,将部分观测问题转化为完全观测问题。最优脉冲控制可以用适应观测滤波的马尔可夫过程的解和当前值来表示。我们将用Longstaff-Schwartz算法说明我们的结果在具有漂移不确定性的几何布朗运动股票价格模型中的应用。
---
分类信息:

一级分类:Mathematics        数学
二级分类:Optimization and Control        优化与控制
分类描述:Operations research, linear programming, control theory, systems theory, optimal control, game theory
运筹学,线性规划,控制论,系统论,最优控制,博弈论
--
一级分类:Quantitative Finance        数量金融学
二级分类:Trading and Market Microstructure        交易与市场微观结构
分类描述:Market microstructure, liquidity, exchange and auction design, automated trading, agent-based modeling and market-making
市场微观结构,流动性,交易和拍卖设计,自动化交易,基于代理的建模和做市
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-5-6 02:57:58
用改变点控制分歧的冲动洛克曼·a·阿巴斯·图尔基*, Ioannis Karatzas+和李清华*TU Berlin,Sto chastik and Finanzmathematik,MA大楼,街17号。Juni 136,10623 Berlin,Germany+美国纽约州纽约市哥伦比亚大学数学系,纽约州纽约市纽约市10027号哥伦比亚大学统计系,阿姆斯特丹大道1255号,纽约州纽约市10027号,美国2018年8月20日摘要本文解决了一个偏差的Bayes序列脉冲控制问题,其漂移具有不可观测的参数和一个变化点。通过改变概率测度,消除漂移,将部分观测问题转化为完全观测问题。最佳脉冲控制可以用阿马尔科夫过程的解和当前值来表示,该过程适用于观察过滤。我们将用Longstaff-Schwartz算法来说明我们的结果在具有漂移不确定性的几何布朗运动股票价格模型中的应用。贝叶斯序列优化;脉冲控制;变化点;措施变更;朗斯塔夫-施瓦茨算法1简介假设股票的价格演化遵循几何布朗运动,其裂痕将在未知的未来时间变化到未知的水平。投资者在初始时间购买一定数量的股票,只能观察价格的变化。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 02:58:01
基于这些观察到的价格和对漂移变化的一些合理的先验知识,为了最大限度地提高投资者的预期收益,出售股票的最佳时机是什么?在同样的情况下,如果股票数量较多,那么最优的离散平衡买卖策略又如何呢?在更抽象的层面上,这是一个关于扩散的最佳停止和脉冲控制的问题,其漂移项有一个不可观测的参数和一个变化点。解决此类问题有三种常见方法。保守的方法是mini-max哲学,它优化了最坏的情况,由[20]Karatzasand Zam Firescu(2008)描述为一个控制者和一个阻止者之间的零和博弈。许多从业者采用的方法是将模型校准和决策分为两个单独的步骤。另一种方法是通过用参数的后验概率分布扩充状态过程,将具有部分观测值的决策问题转化为具有完全观测值的决策问题。这一方法的一个例子是作品[10]戴、张和朱(2010)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 02:58:04
在一个具有漂移不确定性的几何布朗运动价格模型中,作者假设交易活动不受影响,并分别找到两个最优的下单时间序列,即买卖订单。前一段提到的主题都是非常成熟的研究领域,拥有过去几十年的大量文献:其中[32]Shiryaev(1969)和[17]Karatzas(2003)用于顺序检测;[33]Shiryaev(1978)或[19]Karatzas和Shreve(1998)中的附录D,用于最优停止问题;[3] [4]、[5]和[6]作者Bensoussan和L ions,以及[28]Oksendal和Sulem(2007)的脉冲控制;以及s[26]Liptser和Shiryaev(2001)和[7]Bensoussan(1992)使用过滤技术解决部分观测到的控制问题。本文试图在不跟踪后验概率过程的情况下,在贝叶斯序贯框架下一步求解脉冲控制问题。概率测度的变化有助于从部分观测到完整观测的转换,这隐藏了差异的漂移部分。测量变更方法最初是为了解决变更点检测问题而开发的。对于我们的问题,在参考概率测度下,通过似然比增强的状态过程是马尔可夫的,可以推导出由值函数满足的动态规划原理。强化状态过程的当前值提供了决策所需的所有信息。至少有三种广泛使用的方法来描述随机控制问题的值函数——PDE、动态规划和反向SDE。它们是“随机最大原理”概念的不同表述(c.f.[23]Kushner(1972)和[11]Davis(1973))。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 02:58:07
这三种方法的共同机制是,价值函数和累积报酬之和,当沿着与任何允许的控制策略对应的状态过程进行评估时,会产生一个超鞅——当且仅当控制策略为最优时,它才会成为一个最优鞅。在简化到马尔可夫情形之后,我们通过动态规划原理来表示最优脉冲控制。与Bensoussan和Lions的开创性论文[3]、[4]、[5]、[6]和[7]不同的是,与价值函数相关的变分不等式将不在本文中介绍,因为它们在数值上不足以实现,因为它们是一个ugmentedstate过程的维数。从数值的角度来看,我们采用Longstaff-Schwartz算法来获得多个最佳停车时间。该方法基于停车时间的动态规划原理,虽然使用蒙特卡罗模拟,但计算效率很高。对于一个涉及几何布朗运动和两个最优停止时间的简单问题,我们也证明了所得结果的良好精度。通过测量值的变化将其简化为完全观测,以及所提出的涉及蒙特卡罗的算法非常适合高维状态过程。它们对解决部分观测控制问题的方法学做出了贡献。在第2节中,我们指定了要优化的模型和数量。第3节讨论了与在不同概率测度下编写和解决脉冲控制问题有关的主要理论结果。第4节举例说明了如何通过实施Longstaff-Schwartz算法来使用理论结果,以获得多个最佳停车时间。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 02:58:10
最后,我们在第5节中表明,与通常涉及后验概率的方法相比,本文提出的方法为多维问题提供了一个更好的框架。2问题公式本节建立了扩散模型,其漂移与第2节有一个变化点。1并在第2.2.2.1节中阐述了扩散的脉冲控制问题。我们考虑的是一个概率空间(Ohm, F、 P),它支持两个独立的、可测量的随机变量ρ和U,以及关于自然过滤FW的一维标准布朗运动W(·)。随机变量向量(ρ,U)与布朗运动W(·)无关。LetG={G(t)}0≤T≤T=σρ、 U,W(s);0≤ s≤ T0≤T≤T(2.1)表示由ρ、U和W(·)产生的过滤。不可观测过程θ:[0,T]×Ohm → Θ,(t,ω)7→ θ(t,ω)=:θ(t)(2.2)取值于参数空间Θ={u,u,···,um} R.过程θ(·)从初始值θ(0)=u开始,并保持该值直到状态变化的不可观测时间ρ。在时间ρ时,参数θ(·)变为一个新的水平U,一个随机变量,取值于集合{u,···,um},并保持在该水平,直到固定的终端时间T∈ (0, ∞). 如果在timeT之前没有发生制度变化,那么θ(·)在整个区间[0,T]中取值u,即θ(T)=(u,0)≤ t<ρ∧ TU、 ρ∧ T≤ T≤ T(2.3)变化点ρ和水平U具有先验分布sp(ρ>t)=e-λt,t≥ 0,(2.4)和p(U=uj)=pj,j=1,2,·m。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群