全部版块 我的主页
论坛 经济学人 二区 外文文献专区
963 39
2022-06-14
英文标题:
《Conditional Optimal Stopping: A Time-Inconsistent Optimization》
---
作者:
Marcel Nutz, Yuchong Zhang
---
最新提交年份:
2019
---
英文摘要:
  Inspired by recent work of P.-L. Lions on conditional optimal control, we introduce a problem of optimal stopping under bounded rationality: the objective is the expected payoff at the time of stopping, conditioned on another event. For instance, an agent may care only about states where she is still alive at the time of stopping, or a company may condition on not being bankrupt. We observe that conditional optimization is time-inconsistent due to the dynamic change of the conditioning probability and develop an equilibrium approach in the spirit of R. H. Strotz\' work for sophisticated agents in discrete time. Equilibria are found to be essentially unique in the case of a finite time horizon whereas an infinite horizon gives rise to non-uniqueness and other interesting phenomena. We also introduce a theory which generalizes the classical Snell envelope approach for optimal stopping by considering a pair of processes with Snell-type properties.
---
中文摘要:
受P.-L.Lions最近关于条件最优控制工作的启发,我们引入了一个有限理性下的最优停止问题:目标是在停止时的预期收益,条件是另一个事件。例如,代理人可能只关心其停职时还活着的州,或者公司可能以不破产为条件。我们观察到,由于条件概率的动态变化,条件优化是时间不一致的,并本着R.H.Strotz在离散时间内对复杂代理所做工作的精神,开发了一种均衡方法。在有限时间范围内,平衡点本质上是唯一的,而无限时间范围会导致非唯一性和其他有趣的现象。我们还引入了一个理论,该理论通过考虑一对具有Snell型性质的过程,推广了经典的Snell包络最优停止方法。
---
分类信息:

一级分类:Mathematics        数学
二级分类:Optimization and Control        优化与控制
分类描述:Operations research, linear programming, control theory, systems theory, optimal control, game theory
运筹学,线性规划,控制论,系统论,最优控制,博弈论
--
一级分类:Mathematics        数学
二级分类:Probability        概率
分类描述:Theory and applications of probability and stochastic processes: e.g. central limit theorems, large deviations, stochastic differential equations, models from statistical mechanics, queuing theory
概率论与随机过程的理论与应用:例如中心极限定理,大偏差,随机微分方程,统计力学模型,排队论
--
一级分类:Quantitative Finance        数量金融学
二级分类:Mathematical Finance        数学金融学
分类描述:Mathematical and analytical methods of finance, including stochastic, probabilistic and functional analysis, algebraic, geometric and other methods
金融的数学和分析方法,包括随机、概率和泛函分析、代数、几何和其他方法
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-6-14 03:40:45
条件最优停止:时间不一致的优化Marcel Nutz*张玉冲+2019年10月15日根据P.-L.Lions最近关于条件最优控制的工作,我们引入了一个基于理性的最优停止问题:目标是在另一个事件的条件下,停止时的预期收益。例如,代理人可能只关心停止时她还活着的州,或者公司可能以不破产为条件。我们观察到,由于条件可能性的动态变化,条件优化是时间不一致的,并本着R.H.Str otz在离散时间内对复杂代理所做工作的精神,开发了一种均衡方法。研究发现,在有限时间范围内,均衡本质上是唯一的,而在有限时间范围内,均衡会导致非唯一性和其他有趣的现象。我们还引入了一个理论,通过考虑一对具有Snell型性质的过程,推广了经典的Snell包络最优停止方法。条件最优停车;时间-不一致性;平衡2010主题分类60G40;93E20;91A13;91A151简介经典的最优停车问题是在所有停车时间τ上最大化预期收益[Gτ],其中G=(Gt)是给定的自适应过程。在本文中,我们建议研究一个标准,即在τ:supτE[Gτ{τ]时未达到给定停止时间σ的条件σ} ]P(τ σ) 其中τ σ <=> τ<σ或σ=∞. (1.1)*部门。哥伦比亚大学统计与数学系,mnutz@columbia.edu.Research由阿尔弗雷德·P·斯隆奖学金和NSF拨款DMS-1812661资助。MNis感谢Pierre Louis Lions和Abdoulaye Ndiaye的有益讨论。+部。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 03:40:48
多伦多大学统计科学系,余冲。zhang@utoronto.ca.When该模型基于马尔可夫链X,σ的自然选择是给定集合B的第一次退出时间。例如,如果停止决策是由一家公司做出的,一个应用是X在B中表示solvencysoσ是破产时间。事实上,公司可能只关心停止支付发生在σ之前的州,因为公司在其他州不再存在。或者,对于做出财务决策的个人来说,σ可能是死亡时间,那么模型表示,她只关心她活着时支付发生的状态。通常不可能将此类条件问题建模为一个类最优停止问题,除非在条件事件不依赖于停止时间τ的普通情况下。经典的f框架要求我们将其建模为退出时间问题,其中为退出事件指定了一个特定的f(即GTT的值≥ σ). E、 对于可能面临死亡的人,我们不能简单地说:“我不关心死后会发生什么。”相反,我们必须在死亡时指定特定的报酬。即使建模者为了“务实”愿意确定一些价值,也很难做出合理的选择,优化的解决方案通常取决于此。本文的灵感来自P.-L.Lions最近的工作,该工作介绍了条件过程的最优控制。在这里,主要的例子是控制布朗运动的漂移,而支付取决于给定域内的过程。该问题被转化为福克-普朗克方程的最优控制问题,这是一种通过最终条件耦合的特殊类型的平均场博弈问题。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 03:40:51
对域趋向于Rd的经典情况的限制给予了特别关注。虽然观察到最优控制取决于起点,但没有提出时间一致性问题。在本文中,我们介绍了一个据我们所知的具有条件的最优停止问题。我们的一个初步观察结果是,从Strotz的角度来看,问题是时间不一致的【29】:如果一个代理在时间t=0时确定了一个最佳策略,并在以后考虑到她的当前状态重新考虑她的决定,她可能会反驳她之前的决定,并发现她的策略不再是最佳的。在这种动态规划原理不适用的设置中,有不止一个优化的概念。预先提交的问题是在t=0的情况下优化预期的支付效果,假设该决策稍后不会受到质疑;i、 例如,代理“承诺”初始选择。(参考文献[25]的理论与这个概念相对应。)用斯特罗茨的术语来说,一个没有承诺装置的老练的代理人意识到她的“未来自我”可能会推翻她目前的计划。因此,她将此视为“一致计划策略”的约束:他选择她的行为,而忽视她知道自己未来不会执行的计划;也就是说,她选择了一种行为,这样她未来的化身就不会有偏离的动机。由此产生的时间一致性策略被称为子博弈完美纳什均衡,这是我们将重点关注的概念。不同的解释遵循代际模型或重叠代际模型的文献(见[28]及其后的工作),其中未来的决策由下一代而不是其他人自己做出。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 03:40:54
例如,政府机构可能希望考虑到未来的总统任期和在下次选举后不会逆转的选择或政策。除了自身有趣之外,条件停止也可能有助于阐明过程的条件控制,因为最优停止通常比控制更容易处理。1.1文献继[29]的早期工作之后,经济学中出现了大量涉及时间不一致的文献。例如,[27]重新考虑了Strotz的概念,即当决策点的数量发生变化时,采用非指数折扣进行设定,并且[26]研究了随时间变化的偏好。非标准折扣(尤其是双曲线)和时间偏好(如习惯形成)是本文献中时间不一致的最常见原因;有关概述,请参阅[14]。这些模型大多是在有限或有限时间范围内的离散时间内制定的。当优化目标涉及期望的非线性函数时,也会出现时间不一致性,如[2]中的均值-方差准则,或[1、15、23]中的概率扭曲。(概率失真对应于一个优化目标,该目标过度强调或低估了事件相对于其目标概率的重要性。)[10,11]的开创性工作启动了关于如何定义和获得均衡策略以实现连续时间过程的最优控制的研究,当规划师使用非经验贴现时,以拉姆齐问题为例。在连续设置中,及时更改单个实例的控件是没有意义的,因为它不会影响差异。作者开发了一个一阶标准,对应于短时间间隔内控制的变化,这意味着代理可以在短时间内承诺。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 03:40:57
这导致了许多工作,包括具有非指数贴现的投资组合优化【12,13】、平均方差投资组合选择【5,8】和一般线性-二次控制【16,17】。然而,这种平衡的概念并不是唯一可能的;特别是,一阶条件通常不足以实现最优性。最近的研究[21]引入了一个更强的最优性概念,并强调了它们之间的差异。在[3,4]中,作者分别研究了离散时间和连续时间中的时间不一致控制,以及它们之间的关系,这类目标是预期效用和预期效用的非线性函数之和,可能依赖于初始条件。关于依赖于initialcondition的连续时间框架,另请参见[31]。本文最接近的参考文献是[22],作者研究了阿马尔科夫环境下非指数贴现下离散时间的最优停止。在有限水平的情况下,向后递归产生了唯一的平衡。在有限视界的情况下,作者关注的是时间齐次马尔可夫链。在减少不耐烦(包括双曲线贴现)的假设下,通过迭代“战略推理”或“实际游戏”图构建时间齐次均衡(参见第2.1节中的Φ);也就是说,每个代理都会优化其在继续和停止之间的决策,同时根据所有其他代理的决策进行决策。值得注意的是,可以获得对所有试剂都是最优的平衡。我们注意到【22】早于【18】,其中迭代方法首次在连续时间内实现。在[18]中,对于时间均匀差异,获得了时间均匀平衡;对于时间不均匀差异,获得了非均匀平衡。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群