全部版块 我的主页
论坛 经济学人 二区 外文文献专区
2022-6-2 21:30:52
如果(p,1- p) 是玩家1和(q,1)的混合策略- q) 是参与者二的混合策略(两个纯动作的概率选择),让参与者一的报酬为(p,1- p) A(q,1- q) t+最大值(p,1- p) 让玩家二的报酬-(p,1- p) A(q,1- q) t+最大值(q,1- q) 。很容易看出,在通常意义上的最佳回答中不存在纳什均衡,因为对于另一方的任何混合策略,可以通过确定地选择一个或另一个动作来获得1的报酬,然而,两个参与者不可能同时获得1的报酬(因为只有当双方都确定地选择某个活动,并且其中一个参与者的报酬不超过0时,他们的报酬之和才可能至少为2)。人们还可以看到,这场博弈没有如上所述的局部均衡。现在确定参与者一的eiA(q,1)的行动i=1,2的报酬-q) t+最大值(p,1- p) ,其中e=(1,0)和e=(0,1)。对PlayerTwo也一样:他的报酬是-(p,1- p) Aeti+最大值(q,1- q) 。考虑到p和Qa都是固定的,两个参与者的两个行为都会产生相同的预期收益,这意味着近视均衡被定义。人们可以将(,)分布解释为货币波动的偶然结果,这种波动不会改变做出选择的可能性。为了进一步证明均衡概念中的基本差异,请看下面的单人优化示例,其中t既是纳什均衡,又是近视均衡,但它们非常不同。我们的单身人士皮尔斯想投票给唐纳德·特朗普,但却对这样做的愿望深感尴尬。投票亭内的行为是秘密的,但皮尔斯在进入投票亭前的投票意图并非秘密(至少来自他的妻子和最亲密的朋友),这影响了他的行为的效用。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-2 21:30:55
让我们假设p是皮尔斯将投票给特朗普的概率,皮尔斯通过投票意图失去了5 p的效用,无论他实际做了什么。在一切平等的情况下,不考虑p的价值,在投票亭中,特朗普比克林顿有1的优势。在不失概括性的情况下,让我们假设在投票亭中,投票给特朗普和克林顿的效用是1- 5带-分别为5p。不管概率p有多大,投票给特朗普总是比投票给克林顿更可取,这就形成了一种独特的短视平衡,即投票给特朗普(p=1)。用上述方法定义概率单纯形上的支付函数–作为p的函数,桥墩的预期效用为p(1- p) +(1- p)(-5p)=-4p。作为p函数的唯一最优支付是在p=0时获得的0,这意味着对克林顿投了一定的票(这定义了唯一的纳什均衡)。然而,对特朗普的特定投票,独特的近视平衡,导致预期的回报为-我们从这个例子中看到,一人博弈的短视均衡不一定是局部最大值。当近视均衡和纳什均衡都不发生在概率单纯形的边界上时,一个参与者的近视均衡和纳什均衡之间的区别可能存在。现在,无论出于何种原因,我们假设,当一个人实际投票给克林顿时,想投票给特朗普的尴尬感就会消失。按照这个想法,投票给特朗普和克林顿的效用可能是1- 分别为5和0。作为优化问题,分布的预期效用(p,1- p) is(1- 5p)p=p- 5p,一个具有唯一最大解的严格凹函数。通过取导数并将其设置为零,o发现V值在p=(唯一的近视最大值和纳什均衡)时最大化。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-2 21:30:58
然而,在p=时获得了唯一的近视均衡,其中,投票给克林顿和投票给特朗普的效用都相等,并且都等于0。我们相信,近视平衡最相关的应用将是对博弈树中的子博弈有一个新的更自由的理解。按照惯例,子博弈的概念非常严格;这是一个节点,在这个节点上,所有玩家都知道这个节点,只有这个节点已经到达。由于这种限制性定义,学生错误地识别子游戏是很常见的。利用近视平衡的概念,对于遗传算法流程中间的一个子集节点,我们可以将一系列子博弈视为该集合上的分布,由先前采取行动的玩家的混合策略决定。从定理1我们知道,作为这些分布函数的平衡对应具有拓扑结构,这意味着Simon、Spie˙z和andToru'nczyk(2002)的跨越性质。在近视平衡解的结果结构和Payo Off s.6参考文献Aumann,R.和Maschler,M.(1995),《不完全信息的重复博弈》的输入对应关系中,利用跨越性质对定理2进行推广,可以增强这种方向。与R.Stearns合作。马萨诸塞州剑桥:麻省理工学院出版社。Biasi,C.和Monis,T.(2013),《弱局部纳什均衡》,《非线性分析的拓扑方法》,41,第2期,第409-419页。Blackwell,D.(1956),《向量Payoff的极大极小定理的类似物》,太平洋数学杂志,第6期,第1-8页。Hart,S.(1985),《不完全信息非零和二人重复博弈》,《运筹学》第10期,第1117-153号。Hold,M.、Wolfe,P.、Crowder,H.(1974),次梯度优化验证,数学规划6,62-88。Kohlberg,E.和Mertens,J.-F。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-2 21:31:01
(1986),关于均衡的战略稳定性,计量经济学,54(5),第1003-1037页。Kuhn,H.(1953),《广义博弈与信息问题》,《博弈论贡献》,普林斯顿大学出版社,Kuhn和Tucker编辑,第193-216页。Nash,J.(1950),《n人博弈中的均衡点》,《国家科学院学报》,第36期,第48-49页。Neyman,A.(2016),私人通信。Selten,R.(1975),《对广泛博弈中均衡点性能概念的重新审视》,国际博弈论杂志,VOL 4,第1期,第25-55页。Simon,R.S.、Spie˙z,S.和Toru'nczyk,H.(1995),《某些遗传算法中平衡的存在性》,《凸函数族的分离》和《Borsuk-Ulam型定理》,srael数学杂志,第92卷,第1-21页。Simon,R.S.、Spie˙z,S.、Toru'nczyk,H.(2002),《单面不完全信息博弈中的均衡存在与拓扑》,美国数学学会学报,第35卷第4期,第12期,第5005-5026页。Sorin,S.和Zamir,S.(1985),《一方半缺乏信息的双人游戏》,《操作数学研究》h10,17-23。Stapenhorst,C.(2016),《委托代理问题中的噪声信号》,硕士学位论文,数学,L.S.E。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群