全部版块 我的主页
论坛 经济学人 二区 外文文献专区
809 27
2022-05-25
英文标题:
《A Mean Field Game of Optimal Stopping》
---
作者:
Marcel Nutz
---
最新提交年份:
2017
---
英文摘要:
  We formulate a stochastic game of mean field type where the agents solve optimal stopping problems and interact through the proportion of players that have already stopped. Working with a continuum of agents, typical equilibria become functions of the common noise that all agents are exposed to, whereas idiosyncratic randomness can be eliminated by an Exact Law of Large Numbers. Under a structural monotonicity assumption, we can identify equilibria with solutions of a simple equation involving the distribution function of the idiosyncratic noise. Solvable examples allow us to gain insight into the uniqueness of equilibria and the dynamics in the population.
---
中文摘要:
我们构造了一个平均场型随机博弈,其中代理解决最优停止问题,并通过已经停止的参与者的比例进行交互。使用连续的代理,典型的平衡成为所有代理所暴露的公共噪声的函数,而特殊的随机性可以通过精确的大数定律消除。在结构单调性假设下,我们可以用一个包含特殊噪声分布函数的简单方程的解来识别平衡点。可解的例子使我们能够洞察平衡的唯一性和种群中的动力学。
---
分类信息:

一级分类:Mathematics        数学
二级分类:Optimization and Control        优化与控制
分类描述:Operations research, linear programming, control theory, systems theory, optimal control, game theory
运筹学,线性规划,控制论,系统论,最优控制,博弈论
--
一级分类:Mathematics        数学
二级分类:Probability        概率
分类描述:Theory and applications of probability and stochastic processes: e.g. central limit theorems, large deviations, stochastic differential equations, models from statistical mechanics, queuing theory
概率论与随机过程的理论与应用:例如中心极限定理,大偏差,随机微分方程,统计力学模型,排队论
--
一级分类:Quantitative Finance        数量金融学
二级分类:Mathematical Finance        数学金融学
分类描述:Mathematical and analytical methods of finance, including stochastic, probabilistic and functional analysis, algebraic, geometric and other methods
金融的数学和分析方法,包括随机、概率和泛函分析、代数、几何和其他方法
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-5-25 08:25:05
最优停止的平均场对策*第一版:2016年5月30日。本版本:2018年8月27日摘要我们制定了一个平均场类型的随机游戏,其中代理解决最佳停止问题,并通过已经停止的玩家的比例进行交互。使用连续介质时,典型的平衡成为所有介质所暴露的共同噪声的函数,而特殊的随机性可以通过一个精确的大数定律来消除。在结构单调性假设下,我们可以用一个包含特殊性分布函数的简单方程的解来识别平衡。可解的例子使我们能够深入了解种群中平衡的唯一性和动力学。平均场对策;最优停车;Bank RunAMS 2010科目分类91A13;60G40;91A15;91A551简介拥有大量n名玩家的随机游戏是出了名的难以对付的。Lasry和Lions【24、25、26】以及Huang、Malhamé和Caines【19、20】引入了平均场博弈,以研究限制区域中的纳什均衡,其中n趋于统一,玩家通过所有玩家私有状态的经验分布对称互动。给定这样的分布u,每个玩家通常解决一个标准控制问题;也就是说,在支付一定费用的同时控制分歧。另一方面*哥伦比亚大学统计与数学系,mnutz@columbia.edu.阿尔弗雷德·P·斯隆奖学金和NSF拨款DMS-1512900支持的研究。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-25 08:25:09
这项工作通过与布鲁诺·布查尔德、勒内·卡莫纳、伊奥尼斯·卡拉萨斯、丹尼尔·拉克尔、何塞·谢因克曼、尼扎尔·图齐的讨论以及两位匿名裁判的详细评论得到了极大的支持,作者对此深表感谢。回报(以及可能的差异)取决于u,而u又取决于所有代理的行动。在分析理论中,此类系统由非线性偏微分方程(PDE)耦合系统描述:当给定u时,Hamilton–Jacobi–Bellman方程描述最优控制问题,Kolmogorov型方程描述u随时间的演化作为最优控制的结果。其中一个主要困难是,前一个方程自然地从终端条件开始,并在时间上向后运行,而后一个方程向前运行,以确保u的一致性;我们参考[6,17]了解背景。在该理论的概率版本中,使用了随机极大值原理,并将偏微分方程系统替换为耦合的前向-后向随机微分方程;参见[4、7、8、9]。在最简单的情况下,代理暴露于特殊的i.i.d.噪声(本质上,每个扩散方程都是一个独立的布朗运动),因此平衡被表述为确定性的。最近,额外的公共噪声和随机均衡的存在受到了相当大的关注;参见【10、13、16、22、28】。过去十年中,从生产模型到人口动态,出现了各种各样的应用,其中有几项在[18]中进行了总结;有关系统风险的最新模型,请参见[12],有关金融中的价格影响,请参见[13]。虽然平均场游戏是作为大型游戏的一个易于处理的模型引入的,但它们仍然相当复杂。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-25 08:25:12
据我们所知,唯一可以显式解决的情况是线性二次控制(线性动力学,二次成本)。对此情况进行了详细研究;参见[2、3、5、12]。在其他情况下,通常必须通过非线性方程耦合系统来解决f或抽象描述。本论文的主要目的是制定一个可处理的平均场型博弈,其中可以更直接地理解均衡的性质。在我们的案例中,代理将解决最佳停止问题,而不是扩散控制。虽然在标准的平均场游戏中,玩家的(空间)位置很重要,但这里的状态空间是二进制的:每个玩家要么已经停止,要么仍然在游戏中,而互动是通过已经停止的玩家的数量发生的。由于其简单的解释和从银行挤兑模型到交易优化的广泛可能应用,这种结构似乎很有吸引力。勒内·卡莫纳(Rene Carmona)首先向作者指出了这种游戏的可能兴趣。【18】的第2节可以看作是一个前身,至少在精神上是这样的:在一个托耶的例子中,叫做“会议什么时候开始?”代理人间接控制其到达预定地点的时间。另一方面,它在游戏中产生了一个固有的不连续性:经济学中众所周知(例如,[14,27]),最佳时机的游戏可能很容易退化,因为所有玩家都在同一时间停止。因此,其中一个挑战是产生一类典型平衡不平凡的模型。具体来说,我们将研究一个连续时间的随机博弈,其中有一个连续的参与者。在平衡状态下,每个代理i将解决formsupτE的最优停止问题经验值ZτRSD{θ>τ}∪{θ=∞};它有两种相互竞争的力量。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-25 08:25:15
过程r可以解释为只要代理不停止,就应计的报酬利率,从而激励代理留在游戏中。另一方面,还有一个违约时间θ(利息支付机构):如果θ发生在代理离开游戏之前,代理将失去一切。虽然违约对代理人来说是一个“惊喜”,但θ的分布受代理人已知的强度过程γ的控制:γi越大,违约越有可能很快发生。更准确地说,θ被建模为强度为γi的Cox过程的第一次。这导致了单主体最优停止问题的可处理解决方案,我们从金融文献(例如,[23,第5章])中获得了灵感,众所周知,类似环境下的可违约债券将像不可违约债券一样定价,但利率调整后r- γi。代理人对犯规分布的看法是不一致的。我们认为强度γias取决于代理人i使用的主观概率。因此,球员面临不同的最优停球问题,可能在不同的时间达到顶点。经纪人对违约强度的看法也将受到多少球员已经停赛的影响;更精确地说,比例ρt∈ [0,1]的玩家在时间t之前离开游戏。所有代理都会观察到这一过程,并创建平均场类型的交互:如果ρ越大,任何玩家的强度也会越大,这意味着感知到的违约会发生得越快。正如在银行挤兑模型中一样,这表明,如果有更多的客户弃船,那么机构违约的可能性更大。虽然我们将设定的一般公式推迟到第5节,但非典型模型可能会假设γiis的形式为γit=Xt+Yit+cρt。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-25 08:25:19
(1.1)这里,X起着共同噪声的作用(所有代理都是一样的),而Yi是一种特殊噪声,在人群中是i.i.d。根据应用情况,可以将X和yi分别解释为公共信号和专用信号,或者将它们的总和视为真实信号X的噪声观测值≥ 0控制交互强度;也就是说,代理的观点在多大程度上受到ρt的影响。假设τiis是代理i选择的停止时间,代理的连续统由无原子概率空间(i,i,λ)表示。那么,ρt(ω)=λ{i:τi(ω)≤ t} (1.2)是在时间t之前停止的玩家的“比例”。这也可以被视为在时间t的累积分布函数(c.d.f.),用于描述系统在I×{0,1}上的演化,记录每个代理I是否停止(1)(0)。如果我们从一个给定的过程ρ开始,就可以确定试剂的强度γiof。假设相关的最优停止问题有解(τi)i∈一、 默认假设一个合适的可测性,我们可以考虑过程λ{I:τI(ω)≤ t} ,如果满足(1.2),我们应表示ρ和(τi)i∈形成平衡。由于我们正在处理一系列的参与者,单个代理的决策不会影响ρ,因此这个概念对应于纳什均衡:给定其他参与者的策略,每个参与者的行为都是最优的。我们的主要结果(定理5.1)将平衡ρ与有限维方程的解联系起来。例如,在(1.1)的情况下,它的读数为1- u=英尺(r- 十、- cu),u∈ [0,1],(1.3),其中FTI是特殊噪声Yt的c.d.f,r是(恒定)利率。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群