全部版块 我的主页
论坛 经济学人 二区 外文文献专区
1113 29
2022-05-31
英文标题:
《Adaptive Robust Control Under Model Uncertainty》
---
作者:
Tomasz R. Bielecki and Tao Chen and Igor Cialenco and Areski Cousin
  and Monique Jeanblanc
---
最新提交年份:
2017
---
英文摘要:
  In this paper we propose a new methodology for solving an uncertain stochastic Markovian control problem in discrete time. We call the proposed methodology the adaptive robust control. We demonstrate that the uncertain control problem under consideration can be solved in terms of associated adaptive robust Bellman equation. The success of our approach is to the great extend owed to the recursive methodology for construction of relevant confidence regions. We illustrate our methodology by considering an optimal portfolio allocation problem, and we compare results obtained using the adaptive robust control method with some other existing methods.
---
中文摘要:
本文提出了一种新的离散时间不确定随机马尔可夫控制问题的求解方法。我们将所提出的方法称为自适应鲁棒控制。我们证明了所考虑的不确定控制问题可以用相关的自适应鲁棒Bellman方程来解决。我们方法的成功在很大程度上归功于构建相关置信域的递归方法。我们通过考虑最优投资组合分配问题来说明我们的方法,并将使用自适应鲁棒控制方法获得的结果与其他一些现有方法进行比较。
---
分类信息:

一级分类:Mathematics        数学
二级分类:Optimization and Control        优化与控制
分类描述:Operations research, linear programming, control theory, systems theory, optimal control, game theory
运筹学,线性规划,控制论,系统论,最优控制,博弈论
--
一级分类:Mathematics        数学
二级分类:Probability        概率
分类描述:Theory and applications of probability and stochastic processes: e.g. central limit theorems, large deviations, stochastic differential equations, models from statistical mechanics, queuing theory
概率论与随机过程的理论与应用:例如中心极限定理,大偏差,随机微分方程,统计力学模型,排队论
--
一级分类:Quantitative Finance        数量金融学
二级分类:Mathematical Finance        数学金融学
分类描述:Mathematical and analytical methods of finance, including stochastic, probabilistic and functional analysis, algebraic, geometric and other methods
金融的数学和分析方法,包括随机、概率和泛函分析、代数、几何和其他方法
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-5-31 22:10:15
模型不确定性下的自适应鲁棒控制托马斯·比莱克基亚(Tomasz R.Bieleckia),陶陈(Tao Chen),艾戈尔·夏兰科(aIgor Cilenco),aAreski Cousinb(aAreski Cousinb),莫尼克·让布兰奇(Monique JeanBlancfirst)于2017年6月6日发布摘要:本文提出了一种新的方法来解决离散时间内的不确定随机马尔可夫控制问题。我们将所提出的方法称为自适应鲁棒控制。我们证明了所考虑的不确定控制问题可以用相关的自适应鲁棒Bellman方程来解决。我们方法的成功在很大程度上归功于构建相关信任区域的递归方法。我们通过考虑最优投资组合分配问题来说明我们的方法,并将使用adaptiverobust控制方法获得的结果与其他一些现有方法进行比较。关键词:自适应鲁棒控制、模型不确定性、随机控制、动态规划、递归置信域、马尔可夫控制问题、投资组合分配。MSC2010:93E20、93E35、49L20、60J051简介本文提出了一种在离散时间内求解不确定随机马尔可夫控制问题的新方法,并将其应用于最优投资组合选择问题。因此,我们只考虑终端优化准则。问题中的不确定性来自于以下事实:底层随机过程的(真实)规律未知。我们假设,已知的是真正定律所属的潜在概率定律家族。因此,我们在这里处理一个受奈特不确定性影响的随机控制问题。文献中已使用不同的方法对这些问题进行了广泛研究,其中一些问题在第2节中进行了简要描述。解决这个问题的经典方法可以追溯到几位作者。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-31 22:10:18
[GS89]的多重先验或maxmin方法可能是最早的先验方法之一,也是经济学文献中最著名的方法之一。在我们的终端标准的背景下,它本质上相当于formsupД的一个鲁棒控制问题(事实上是一个博弈问题)∈AinfQ∈MEQL(X,Д,T),其中Д是控制过程,A是容许控制的族,M是可能的潜在概率模型(或先验)的族,EQdenotes在先验Q下的期望,X是基础过程,T是有限的优化范围,其中L是优化标准。家族M代表骑士式的不确定性。伊利诺伊理工学院应用数学系邮件:tbielecki@iit.edu(T.R.Bielecki),tchen29@iit.edu(T.Chen)和cialenco@iit.edu(I.Cialenco)URL:http://math.iit.edu/~bielecki和http://math.iit.edu/~IGorbinstitute de Sciences Financial\'ere et d\'Assurance,Universit\'e Lyon 1,Lyon,Francee邮箱:areski。cousin@univ-lyon1.fr,URL:http://www.acousin.net/cUniv埃弗里,LaMME UMR CNRS 807,巴黎萨克莱大学,91025,埃弗里,法国邮箱:monique。jeanblanc@univ-埃弗里。fr,URL:http://www.maths.univ-evry.fr/pages_perso/jeanblanc2Bielecki、Cialenco、Chen、Cousin、JeanBlanch上述maxmin配方已进一步修改,以达到UPД的效果∈AinfQ公司∈MEQ(L(X,Д,T)- c(Q)),其中c是惩罚函数。我们参考[HSTW06]、[Ski03]、[MMR06]和[BMS07]以及其中的参考文献,以讨论和研究该问题。在我们的方法中,我们不使用惩罚条款。相反,我们应用了一种学习算法,旨在减少过程X演化背后真实概率结构的不确定性。这导致我们考虑我们所称的自适应鲁棒控制问题。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-31 22:10:21
我们强调,我们的问题和方法不应与[IS12]和[BWH12]中提出的问题和方法混淆。[KOZ14]中对一个涉及学习的连续时间不确定控制问题进行了一项非常有趣的研究。本文的组织结构如下。在第2节中,我们简要回顾了解决模型不确定性随机控制问题的一些现有方法,从鲁棒控制方法开始,然后是强鲁棒方法、无模型鲁棒方法、贝叶斯自适应控制方法和自适应控制方法。此外,我们还介绍了该方法的基本思想,即自适应鲁棒控制,以及它与现有方法的关系。第3节专门介绍自适应鲁棒控制方法。我们从建立模型开始,在第3.1节中,我们严格描述了随机控制问题。第3.2节讨论了自适应鲁棒问题的解决方法。在本节中,我们还推导了相关的Bellman方程,并证明了考虑自适应鲁棒问题的Bellman最优性原则。最后,在第4节中,我们考虑一个示例,即经典的动态最优配置问题,当投资者每次决定通过最大化终端财富的预期效用投资风险资产和无风险银行账户时。在此,我们还将所提出的方法与现有的一些经典方法进行了比较分析。2模型不确定性下的随机控制(Ohm, F)是可测量的空间,且T∈ N是固定的时间范围。设T={0,1,2,…,T},T={0,1,2。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-31 22:10:24
T- 1} ,和Θ Rdbe是一个非空集,它将始终扮演KnownPareter空间的角色。在空间上(Ohm, F)我们考虑一个随机过程X={Xt,t∈ T}在某个可测空间中取值。我们假设观察到这一过程,并用F=(Ft,t)表示∈ T)其自然过滤。X的真定律未知,并假设由属于上的概率分布参数族的概率度量生成(Ohm, F),表示P(Θ)={Pθ,θ∈ Θ}. 我们将写EPto表示对应于概率度量的期望(Ohm, F),为了简单起见,我们用Eθ表示与概率Pθ相对应的期望算子。按Pθ*我们表示生成X真定律的度量,因此θ*∈ Θ是(未知)真参数。由于假设Θ是已知的,因此本文中讨论的模型不确定性仅在Θ6={θ时发生*}, 我们假设是这样的。通常,参数空间可能是有限维的,例如由动态因素组成,如时间的确定函数或隐马尔可夫链。在本研究中,为了简单起见,我们选择参数空间作为Rd的子集。在大多数应用中,为了避免约束估计问题,参数空间被视为等于Rd的最大相关子集。自适应鲁棒控制3本文提出的方法是由以下一般优化问题驱动的:我们考虑一个族,例如,F–适配过程的φ={φt,t∈ 定义日期(Ohm, F),在可测量空间中取值。我们把A的元素称为容许控制过程。此外,我们考虑了X和ν的一个泛函,我们用L表示。目前的随机控制问题是infД∈AEθ*(L(X,Д))。(2.1)然而,如上所述,由于θ的值*未知。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-31 22:10:27
因此,我们将此类问题称为不确定随机控制问题。接下来的问题是如何处理受这种模型不确定性影响的随机控制问题(2.1)。解决这种不确定随机控制问题的经典方法是:o解决鲁棒控制问题∈Asupθ∈ΘEθ(L(X,Д))。(2.2)关于鲁棒控制问题的更多信息,我们参考,例如,【HSTW06】、【HS08】、【BB95】解决强鲁棒控制问题∈AsupQ公司∈Qν,ΘKνEQ(L(X,ν)),(2.3)其中,ΘKis是骑士对手选择的一组策略(自然)和Qν,ΘKνa概率集,取决于策略ν和给定的定律νonΘ。有关此问题的正式描述,请参见第3节,有关相关工作,请参见[Sir14]和[BCP16]解决无模型鲁棒控制问题∈AsupP公司∈PEP(L(X,ν)),(2.4),其中P为(Ohm, F)。o为了解决贝叶斯自适应控制问题,假设(未知)参数θ是随机的,建模为随机变量Θ,取Θ中的值,并具有由ν表示的先验分布。在此框架中,通过以下优化问题来解决不确定控制问题∈AZΘEθ(L(X,ν))ν(dθ)。我们参考,例如,【KV15】。o解决自适应控制问题,即首先针对每个θ∈ ΘsolveinfΘ∈AEθ(L(X,Д)),(2.5),并用Дθ表示相应的最优控制(假设存在)。然后,每次∈ T、 计算点估计值bθtofθ*, 使用所选的可测量估值器bΘt。最后,在时间t应用控制值Дbθtt。我们参考,例如,【KV15】、【CG91】。4比莱基、夏兰科、陈、堂兄、让·布兰奇现在的评论顺序如下:1。关于鲁棒控制问题的解决方案,[LSS06]观察到,如果真实模型是最差的,那么这个解决方案将是很好的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群