全部版块 我的主页
论坛 经济学人 二区 外文文献专区
2022-5-7 03:10:32
B ut,表示ω/∈ ∧i,Pi(λj)≥ 3/5 |ω)=2/5>=gi≥gi(ω),因此,与前面的例子相比,定理6.2中的第二个条件不成立,(Bf(Df(λ)),Bf(Df(λ)))不是一对合作变量。我们现在认为,唯一一对合作事件是(, ). 相反,假设存在一对非空的合作事件(K,K)。对于i=1,2表示λ*i:=inf{λi(ω)|ω∈ 基尼。自从Ki λi,λ*我≥ 3/5.注意Pi(Kj |ω)与世界ω的状态无关;用π(Kj)表示该量。从Th eorem 6.2的第一个不等式中,我们得到了pi(Kj)≥ 每ω的fi(ω)∈ 因为fi是连续的,π(Kj)≥ fi(λ)*i) 。我们现在认为如果λi(ω)>λ*i、 那么ω∈ 基。否则,我们从定理6.2的secon d不等式推导出,Pi(Kj)≤ gi(ω)≤ gi(ω)=fi(ω)。因为λi(ω)>λ*iit表示fi(ω)<fi(λ)*(一)≤ Pi(Kj),一个矛盾。因此,我们得到Pi(Kj)=1- λ*j、 接下来,我们讨论Pi(Kj)=fi(λ)*i) 。否则Pi(Kj)>fi(λ)*i) 这里是世界的状态ω∈ Ohm 使得Pi(Kj)>fi(ω)>fi(λ)*i) 。从λ的定义*我有ω/∈ Ki,但我们应该有π(Kj)≤gi(ω)=fi(ω),一个矛盾。我们的结论是1- λ*j=fi(λ)*i) 对于i=1,2。因为fi(λi)=1-λi2λi,我们有-λ*2λ*= 1.- λ*= 2λ*(1 - λ*), 或等价地,λ*λ*=. 但是λ*我≥ 3/5表示i=1,2,这是一个矛盾。在以下示例中,Bfii(Df(λ))6= 不满足定理6.2中的条件,但对于较小的非空集,这些条件成立,因此定义了贝叶斯均衡。例6.4设a=5,且Ohm = {,,}. 玩家的bel i efs来自一个共同的先验,它是整个游戏的均匀分布Ohm. 这里λi=,因此∧i={λi(·)≥}.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:10:36
如例e 6.3所示,Bfii(Df(λ))=Dfi(λi,λj)=∧i,但命题6.2的第二个条件不成立,因为gi:P(λ|(,λ))=2/3>=gi。对于Ci={λi=},我们得到Dfi(Ci,Cj)=Ci,我们可以验证命题6.2的第二个条件是否成立。因此η*i(ω)=τ*iλi=,σiλi=,定义了贝叶斯均衡。6.2“几乎”完全信息Monderer和Samet(1989)使用公共p-b信条的概念来衡量近似的公共知识。一个自然的问题是,什么时候是常见的(1- ε) -关于su fficientlySallε>0的折扣系数,有一对合作事件接近(λ,λ),这是完整信息情况下最大的一对合作事件。在本节中,我们为notio on“几乎完整的信息”提供了两个自然定义;一方面,我们提出的问题的答案是否定的,另一方面,答案是肯定的。我们在没有证据的情况下给出结果;感兴趣的读者请参阅Maor(2010)的补充示例和完整证明,这些基本上是定理3.2和6的应用。2和Monderer和Samet(198 9)的结果。本节中的讨论与Monderer和Samet(19 96)有关,他们表明,共同重复p信念的概念与纳什均衡对应关系相对于信息结构的连续性有关(另见Einy etal.(2008))。例5.5表明,当每个参与者大致知道另一个参与者的折扣系数时,合作事件可能与∧显著不同;即使我们只考虑某些δ>0的δ平衡,这也是正确的。完全信息情形的其他扰动概念也是可能的,它们可能产生不同的结果。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:10:39
例如,Weinstein和Yildiz(2007)中的Structurateorem表明,信念的乘积拓扑结构存在微小的扰动,使得任何条件严酷触发策略都不合理。根据Monderer和Samet(1989),我们可以对几乎完整的信息给出以下定义。定义6.5假设世界上的一组状态有一个共同的优先级。设,δ>0。我们说,贴现因子几乎是关于和δ的完全信息,如果真实贴现因子是公共的世界状态集——(1)- )-信念至少有1个概率- δ.换句话说,这一定义意味着,在世界上大多数国家,高p的共同p信念中的真实自然状态,即自然的真实状态以高概率已知,事实以高概率已知,等等。根据Monderer和Samet(1989)中的定理B,我们推导出,如果自然状态的数量是有限的,则存在一个策略属性η和一个事件Ohm′概率至少为(1- 2)(1 - δ) ,使得(a)η(ω)=η*(λ,λ)(ω)对于每个ω∈ Ohm′, (b)η是′>4M的′-平衡,其中M是玩家在世界任何状态下可以获得的最大绝对值:M:=supω∈Ohm马克萨∈A×Amaxi=1,2ui(A)1- λi(ω)<∞.换句话说,在完全信息的情况下,存在一个′-均衡,它与最大合作的条件严酷触发均衡在一个大集合上重合。在囚徒困境和其他2×2博弈中,这个函数η可以定义为一个条件严酷触发函数,如下命题所述。在命题的陈述中,fε是(7)中定义的从分子中减去ε后的函数。假设每个玩家有两个动作。设>0和δ>0,表示M:=2 maxi=1,2(ui(σ)-ui(τi,σj))。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:10:42
假设贴现因子是关于和δ的几乎完全信息。然后,每≥ M,战略规划η*(Bf′(Df′(λ)),Bf′(Df′(λ)))是一个′-平衡,P(λ\\ Df′(λ))<δ。对于一个玩家有两个以上动作的游戏,pro fileη可能不是一个条件严酷的策略pro file。此外,即使是在有限状态空间的情况下,也可能不存在任何条件格林触发′-平衡(见Maor(2010)中的示例8.3)。这是因为对几乎完全信息的定义允许存在概率很小的“问题”状态,在这种状态下,参与者的信念可能远不是完全信息,而定理6.2中的条件(b)和(c)对世界上的所有状态都有要求。因此,对于大于2×2的博弈中的条件gr im触发策略,要获得一个与完全信息情况下最大合作的条件grim触发均衡在一个大集合上重合的′-均衡,我们需要一个更强大的几乎完全信息概念,它在世界上所有状态下都是“几乎完全的”,而不仅仅是世界上的一系列国家。定义6.7设>0。我们说贴现因子是关于的几乎完全信息,如果在世界的每一个状态ω,每一层(1)- )-相信某种自然状态是常见的-(1)- )-bel i ef inω。根据这一定义,当信息几乎完整时,我们可以指出条件严酷触发策略中的′-均衡:命题6.8让>0。假设贴现系数是关于的几乎完整信息(根据定义6.7)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:10:45
然后,战略规划η*(B1)-(D1)-(λ)),B1-(D1)-(λ)))是一个′-平衡,在每个′>M中,M>0是一个常数,与形式结构和无关。尽管折扣系数s的信息几乎是完整的(根据定义6.7),即使这里没有常见的先验知识,但如果有共同的先验知识,那么这个概念比定义6中的概念更强。5.在这种情况下,在一个共同的先验条件下,上述条件格里姆特里格策略中的′-均衡确实在一个大集合上与完全信息情况下最大合作的条件格里姆触发均衡一致,如下命题所述。换句话说,在几乎完全信息的更强概念下,我们得到了一个与Monderer a and Samet(1989)定理B中的结果非常相似的结果,但有一个条件严酷触发函数,它是为世界上的每个国家明确定义的。命题6.9设>0。假设(a)玩家的信念来源于一个共同的先验P;(b) 贴现系数是关于的几乎完整信息(根据定义6.7);(c)自然状态的数量是有限的或可数的。然后(i)战略规划η*(B1)-(D1)-(λ)),B1-(D1)-(λ))是一个′-平衡,对于每一个′>M,其中M>0是一个常数,与玩家的信仰和无关;(ii)根据该战略文件,双方合作的条件是且仅当ω∈ D1-(Λ); 和(iii)P(λ\\D1)-(λ)<36.3进一步的推广也可以推广到其他情况,对函数F和G以及集合∧i进行必要的调整。一种推广适用于关于自身贴现因子的信息不完整的情况。第二个泛化涉及两个以上玩家的游戏。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:10:48
在这些情况下,使用类似的想法,可以获得关于条件触发策略中均衡的效率条件的模拟结果。由于在多人游戏中,信息结构和游戏结构更为复杂,因此需要做出进一步的假设。例如,在两个以上参与者的情况下,要在一个函数f的框架内处理所有其他参与者,需要采取一些“最坏情况场景”。这使得这些条件不仅有效,而且没有必要。详见Maor(2010)。最后,该定理可以推广到具有不完全信息的一般对策。设G=(N,(S,S),π,(Ai)i∈N、 (ui)我∈N) 做一个普通的两人游戏。为了避免可测量性问题,假设世界的状态集是有限的或可数的。假设有一个行动过程*= (σ*, σ*) 当信息完整时,这是自然界所有状态的平衡,还有另一个作用过程,τ*= (τ*, τ*) 只有在某些自然状态下,当信息完整时,这才是一种平衡。假设τ的支撑*土地σ*我脱离了世界上所有的状态;也就是说,可以看出我是否在玩游戏*iorτ*i、 玩家i的策略是一个i-可测量的函数,它将玩家i的行为过程分配给世界的每个状态。让∧i Ohm “成为事件参与者”我认为他不能通过偏离规则而获益*”. 也就是说,对于每一个ω∈ ∧i和玩家i,Ei(ui(τ)的每个动作过程σ′iof*) | ω) ≥ Ei(ui(σ′i,τ)*j) |ω)。定理6.10博弈G中存在i-可测函数0≤ fi,gi≤1,i=1,2,如果K ∧和K ∧,战略规划η*(K,K)=(η)*(K) ,η*(K) )是贝叶斯均衡当且仅当i=1,2,1。π(Kj |ω)≥ 每ω的fi(ω)∈ Ki和2。π(Kj |ω)≤ gi(ω)表示e非常ω/∈ 基。或者,换句话说,当且仅当1。基 Bfii(Kj)和2。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:10:50
Kci 地下一层-gii(Kcj)。定理6.10和定理6.2之间有几个不同之处。首先,我们假设K ∧和K 而在定理6.2中,我们证明了η是必要的*(K,K)是贝叶斯均衡。这个弱化的结果允许我们放弃τ的假设*iis不是对σ的最佳反应*j、 而且只需要能识别玩家i是否在玩游戏*iorτ*i(不相交的支持)。第二,我们不假设已实现的回报是可以观察到的,因此玩家所知道的只是基于他对自然状态的信息的预期回报。第三,我们不认为当τ*玩的时候比玩的时候高*正在播放。关于进一步的概括和完整,请参阅Maor(2010)。附录:定理3.2的证明,因为游戏者i的策略是∑i-可测函数,η的一个必要条件*i(Ki)是一个战略,它是∑i-可测量的。每一次我∈ {1,2},设Kibe为∑i-可测事件。我们将检查与η的偏差*(K,K)可以是可配置的。首先假设ω∈ 基。在这种情况下,玩家我应该遵循可怕的触发动作GT*.如果ω6∈ Kj,玩家j将在整个游戏中玩D,不管玩家i玩什么∈ Kj,球员j将遵循严酷的触发行动路线GT*. 因此,如果玩家i在k阶段偏离并玩D,那么如果他在k阶段之后继续玩D,那么他将获得最高的回报。因为如果k阶段偏离D对玩家i有利,那么在第1阶段偏离D会提供更高的回报。因此,玩家i的最佳可能偏离是行动过程D*. 当且仅当γi(η*(Ki,Kj)|ω)≥ γi(D)*i、 η*j(Ki,Kj)|ω,(8)式中D*iis玩家i的策略中,他总是扮演D。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:10:54
没有人能证明γi(η*(Ki,Kj)|ω)=Pi(Kj |ω)1.- λi(ω)+ (1 - Pi(Kj |ω))λi(ω)1- λi(ω)。(9) 尽管如此,如果我们假设τ*iis不是对σ的最佳回应*jand如果支付是有界的,则fi>0。事实上,根据玩家i的信念,概率Pi(Kj |ω)玩家jpgt*, 所以他们在每个阶段都会玩(C,C),他的报酬是1-λi(ω),概率为(1- Pi(Kj |ω)玩家j扮演D*, 因此,在第一阶段,他将得到0,然后球员们将玩(D,D);因此,在这种情况下,游戏者i的payoff是λi(ω)1-λi(ω)。同样,γi(D*i、 η*j(Kj)|ω)=Pi(Kj |ω)4+λi(ω)1-λi(ω)+ (1 - π(Kj |ω))1.-λi(ω).(10) 在(8)中插入(9)和(10)得到D*iis不是玩家i的可预测偏差当且仅当Pi(Kj |ω)≥ fi(ω),即条件(b)。Sincefi(ω)>1表示ω/∈ ∧i,这也意味着Ki ∧i,即条件(a)。现在假设ω/∈ 基。在这种情况下,η*i(K,K)玩家我遵循行动过程D*. 如果我跟随η*i(K,K)在第一阶段,然后从第二阶段开始,玩家j将玩D,然后玩家i的最佳回答是玩D。如果ω6∈ Kj,球员j跟着D*, 和η*i(K,K)是球员i的最佳回应。如果ω∈ Kj,球员j跟随GT*, 因此,如果对球员i有有利的偏离,他必须在第一阶段偏离。因此,要检查η*(K,K)是贝叶斯平衡,我们需要检查γi(η*(K,K))≥ γi(GT*i、 η*j(K,K)),其中GT*这是玩家i行动的严酷触发过程。可以验证γi(η*(K,K)|ω)=(1)-Pi(Kj |ω))1- λi(ω)+Pi(Kj |ω)4+λi1- λi |ωγi(C)*i、 η*j(Kj)|ω)=Pi(Kj |ω)1- λi(ω)+(1)- π(Kj |ω))λi(ω)1- λi(ω).不等式γi(η)*(K,K))≥ γi(GT*i、 η*j(K,K))然后降低到Pi(Kj |ω)≤ 得到了fi(ω)和条件(c)。最后,我们需要验证fiis∑i-可测量。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:10:57
这个函数是λi的任意函数,因此它是λi的Borel函数。因为∑i包含集合{ω|λi(ω)∈ B} ,对于每个开放集B [0,1),fi作为ω的函数,确实是∑i-可测的。参考文献[1]M.Blonsky和D.Probst。沟通诚信。美墨,2008年。[2] S.Chassang和S.Takahashi。重复博弈中对不完全信息的鲁棒性。《理论经济学》,2011年6:49-93。[3] E.德克尔、D.福登伯格和S.莫里斯。临时的,临时的。《理论经济学》,2007年2:15-40。[4] E.艾尼、O.海曼科、D.莫雷诺和B.希托维茨。具有不同信息的零和对策中值的一致连续性。运筹学数学,33:552-5602008。[5] A.Kajii和S.Morris。常见的p信念:一般情况。《游戏与经济行为》,18:73-821997。[6] E.莱勒和A.帕兹纳。具有不同时间偏好的重复游戏。《计量经济学》,67:393-4121999。[7] E.莱勒和L.亚里夫。一方信息不完全的重复博弈:不同折扣因素的情况。运筹学研究数学,24:204-2181999。[8] C.毛尔。不完全信息下的合作,统计因素,硕士论文特拉维夫大学,2010年。http://arxiv.org/abs/1012.3117[9] M.马斯切勒、E.索兰和S.扎米尔。博弈论。剑桥大学出版社,第20-13页。[10] 蒙德里尔和萨米特。用共同的信念接近共同的知识。《游戏与经济行为》,1989年1:170-190。[11] 蒙德里尔和萨米特。不完全信息博弈中信息的可预测性。《操作数学研究》,21:7077252996。[12] 莫里斯。重温大致的常识。《国际博弈论杂志》,28:385-4081999。[13] S.莫里斯和A.卡吉。平衡点对不可压缩信息的鲁棒性。《计量经济学》,65:1283-130997。[14] J.沃森。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:11:00
从小事做起,重新谈判。经济理论杂志,85:52-901999。[15] J.沃特森。从小做起,勇于承担。《游戏与经济行为》,38:1761992002。[16] J.Weinstein和M.Yildiz。一个合理化能力的结构定理,应用于对需求的稳健预测。Econo metrica,75(2):365-4002007。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群