全部版块 我的主页
论坛 经济学人 二区 外文文献专区
1274 23
2022-05-09
英文标题:
《Nash equilibria for non zero-sum ergodic stochastic differential games》
---
作者:
Samuel N. Cohen and Victor Fedyashov
---
最新提交年份:
2017
---
英文摘要:
  In this paper we consider non zero-sum games where multiple players control the drift of a process, and their payoffs depend on its ergodic behaviour. We establish their connection with systems of Ergodic BSDEs, and prove the existence of a Nash equilibrium under the generalised Isaac\'s conditions. We also study the case of interacting players of different type.
---
中文摘要:
在本文中,我们考虑了非零和对策,其中多个参与者控制一个过程的漂移,其收益取决于其遍历行为。我们建立了它们与遍历BSDE系统的联系,并证明了在广义Isaac条件下纳什均衡的存在性。我们还研究了不同类型的互动玩家的情况。
---
分类信息:

一级分类:Mathematics        数学
二级分类:Probability        概率
分类描述:Theory and applications of probability and stochastic processes: e.g. central limit theorems, large deviations, stochastic differential equations, models from statistical mechanics, queuing theory
概率论与随机过程的理论与应用:例如中心极限定理,大偏差,随机微分方程,统计力学模型,排队论
--
一级分类:Mathematics        数学
二级分类:Optimization and Control        优化与控制
分类描述:Operations research, linear programming, control theory, systems theory, optimal control, game theory
运筹学,线性规划,控制论,系统论,最优控制,博弈论
--
一级分类:Quantitative Finance        数量金融学
二级分类:Economics        经济学
分类描述:q-fin.EC is an alias for econ.GN. Economics, including micro and macro economics, international economics, theory of the firm, labor economics, and other economic topics outside finance
q-fin.ec是econ.gn的别名。经济学,包括微观和宏观经济学、国际经济学、企业理论、劳动经济学和其他金融以外的经济专题
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-5-9 11:26:29
非零和遍历随机微分对策的纳什均衡*牛津大学Victor Fedyashovov牛津大学2018年8月26日摘要我们考虑非零和博弈,其中多个参与者控制一个过程的漂移,他们的收益取决于其遍历行为。我们建立了它们与能量型BSDE系统的联系,并证明了在广义Isaac条件下纳什均衡的存在性。我们还研究了不同类型的互动玩家的情况。MSC:91A60,49N70,93E20关键字:遍历博弈,纳什均衡,BSDE1简介非零和随机微分博弈领域在过去几十年中一直是一个深入研究的主题。它处理的情况是,多个参与者都试图最大化他们的报酬,但所有参与者的报酬总和并不是任何常数。基本目标是找到一个纳什均衡点——所有参与者的一套策略,这样他们就不会从单方面的偏离中受益。Hamad`ene、Lepeltier和Peng在[5]中率先研究了这个问题与倒向随机微分方程(BSDE)之间的联系,并在他们之前在Hamad`ene和Lepeltier[7]中关于零和博弈的工作的基础上进行了进一步的研究。从那时起,它在多个环境中被讨论过,例如[11]中的Karatzasand Li的控制和阻止游戏,以及[12]中的El Karoui和Hamad`ene的风险敏感控制游戏。本文的主要目的是证明一个平衡点的存在性,在这种情况下,我们有两个遍历的漂移控制参与者,即他们在有限的视野内选择他们的策略,并优化长期平均值。按照标准方式(s e e,例如Hamad`ene和Mu[8]),我们在哈密顿量上施加所谓的Generalise d Isa ac条件,以确保两个参与者同时达到最小值。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 11:26:32
然后证明了对策鞍点的存在性源于解的存在性*该研究由Oxf-ord-Man定量金融研究所和theOxford-Nie金融大数据实验室支持。具有连续系数的遍历BSDE系统。使用改进版的P ic ard迭代(本质上与胡安和唐在[10]中使用的定点构造相同),以及Debusche、Hu和Tessitor[4]和作者[3]中建立的EBSDE解的一系列估计,我们证明这样的系统确实允许解。然后,我们将这些结果推广到有限或可数多个参与者的情况。作为开发处理e-rgodic博弈所需机制的副产品,我们得到了一类具有连续线性增长驱动的ebsde解的存在性。最后一节讨论了非对称博弈,其中一个博弈者是纯遍历的,另一个博弈者也会在有限的时间内进行优化,但更看重当前而非未来(即使用折扣)。我们证明了这样一个博弈的价值是存在的,并且证明了当贴现率为零时收敛到遍历系统。2.我们首先描述不受控的正向过程{Xt}t≥0,续集中的玩家将对其产生影响。让{Xt}t的动力学≥0受It^o SDE控制:dXt=(AXt+F(Xt))dt+σdWt,X=X∈ RN,(1)其中W表示RN中的标准布朗运动,在测度P下。我们需要一些初步假设。假设1。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 11:26:36
保证存在唯一强大解决方案的条件(1):o三重(Ohm, F、 P)是概率空间,{Ft}t≥0是一个正确的连续过滤,每个t的FTI都已完成。o过程{Wt}t≥0是过滤{Ft}t中具有可预测表示性质的布朗运动≥0.o算子A是耗散的,并生成一个稳定的半群{etA}t≥换句话说,存在常数u>0,M>0,例如hax,xi≤ -ukxk和k≤ 我-uthold适用于所有x∈ R和所有t≥ 0.本文及其他部分k·k证明了欧几里德范数(或矩阵的弗罗贝尼乌斯范数)图F是一致Lipschitz连续且有界的矩阵σ是可逆的。备注1。由于我们将考虑(1)的遍历行为,在各种概率测度下,我们需要小心不要以通常的方式完成过滤。上述要求是不标准的,但很容易看出,所有常见的存在证明都是通过及时粘贴来实现的。下面的结果是Gr–onwall引理和耗散性条件的一个简单应用:定理1。如果假设1满足,则方程(1)存在唯一的强解。此外,EkXtk< C(1+kxk),其中常数C依赖于M,u,但与t无关。证明:假设Lipschitz连续性,则(1)的astrong平方可积解的存在性为标准d。固定常数k>0。应用It^o公式计算EktkxTk,并取期望值,得到EktkxTk=Ekxk+ZtkekskXskds+EZteksG(s)ds,其中g(s)=2hAXt+F(Xt),Xsi+kσk≤ -2ukXsk+hF(Xs),Xsi+kσk。考虑到假设1并应用Cauchy–Schwarz,我们发现,对于任何>0的情况,都存在C,例如g(s)≤ -2(u - )kXsk+C,代表0≤ s≤ t、 然后,选择<u和k<2(u- ),我们到达一个Tekxtk≤ Ekxk+Ckekt,总结证明。备注2。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 11:26:40
通过将It^o引理应用于Kxtk,并使用定理1证明中相同的推理,我们还可以证明Ekxtk≤ C(1+kxk),(2)对于一些与时间无关的常数C。备注3。如果漂移的非线性部分F(·)是有界可测映射,则(1)仍存在弱意义下的解。换言之,对于任何T>0,都存在一个度量PT~ P、 还有一个?PT布朗运动?∈ [0,T],Xt=etAx+ZtesAF(Xs)ds+ZtesAFσdW(s),该解决方案在法律上是唯一的(对于不同的ofT<∞, 因此,W是唯一定义的)。此外,由于该解可以通过从强解到方程的测度变换而不产生漂移,{Wt}t∈[0,T]在过滤{Ft}T中具有可预测的表示属性∈[0,T]在PT下,适用于所有T。有关详细信息,请参见[2]中的第15章和第18章。如果我们假设Ohm 是一个标准的维纳空间,那么科尔莫戈罗夫的扩张理论可以用来定义一个测度!≥0,因为在fw中存在太多的空集会有问题。在更一般的情况下,这个扩展是一个非常重要的练习,例如,请参见Parthasarathy[15]。设U×Ube是一个控制的可寓言度量空间,其中(ut(ω),vt(ω))取值。用Li表示:RN×U×U→ R、 i=1,2,有界可测代价函数,使得| Li(x,u,v)- Li(x′,u,v)|≤ Ckx- x′k,对于某些C>0的情况。给定任意一对容许控制(u,v)(即可预测随机过程({ut}t≥0,{vt}t≥0),我们定义了Girsanov密度ρu,vT:=expZTR(ut,vt)载重吨-ZTkR(ut,vt)kds对于某些函数R:U×U→ RN,满足kR(·,·)k≤“有些是C”\'C>0。我们定义了概率Pu,v,T:=ρu,vTP。对于每个代理(i=1,2),我们定义了三次支付(u,v)=lim supT→∞T-1Eu,v,TZTLi(Xt,ut,vt)dt.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 11:26:44
(3) 目标是找到一个可接受的控制(u*, 五、*), 这样的*, 五、*) ≤ J(u,v)*) 和J(u)*, 五、*) ≤ J(u)*, v) 适用于所有可接受的(u,v)。为了使用动力学原理来确定最佳的u和v,我们定义了(u,v)的哈密顿函数{Hi}i=1,2,asHi(x,zi,u,v)=ziR(u,v)+Li(x,u,v)(4)∈ U×U。我们注意到,对于一对固定的控制(U,v),对于每一层(i=1,2),支付(3)是一个erg odic平均值。考虑以下遍历倒向随机微分方程(EBSDE),其中哈密顿量起驱动项的作用:Yit=Yit+ZTt[Hi(Xs,Zis,us,vs)- λi]ds-ZTtZisdWs。(5) 假设存在一个三重态(Yi,Zi,λi)到(5),并且存在一个常数C=C(x)>0,与T无关,使得Eu,v,T | Yit |<C为0≤ T≤ T<∞. 然后,通过改变度量并除以T,我们立即得到tJi(u,v)=λi。我们称(5)为响应于值函数(3)的BSDE cor。为了继续进行,我们假设如下:假设2。下面(i)部分被称为广义艾萨克病。第二部分是技术条件,后面将讨论其背后的动机。(i) 存在可测量的地图*, U*, 定义在R3N上,数值分别以uandu表示,例如h(x,z,u*(x,z,z),u*(x,z,z))≤ H(x,z,u,u)*(x,z,z))和h(x,z,u*(x,z,z),u*(x,z,z))≤ H(x,z,u)*(x,z,z),v)适用于所有(x,z,z,u,v)∈ R3N×U×U.(ii)映射(z,z)∈ R2N→ (H)*, H*)(x,z,z)对于任何固定的x都是连续的。考虑上述条件的一种方法是将零和框架中使用的标准假设自然扩展到非零和情况。实际上,考虑两个参与者的情况,一个最大化,另一个最小化函数lj(u,v)=lim supT→∞T-1Eu,v,TZTL(Xt,ut,vt)dt,通过选择控件(ut、vt)∈ U×Ufor t≥ 0
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群