全部版块 我的主页
论坛 经济学人 二区 外文文献专区
1511 65
2022-05-31
英文标题:
《Best reply structure and equilibrium convergence in generic games》
---
作者:
Marco Pangallo, Torsten Heinrich, J Doyne Farmer
---
最新提交年份:
2018
---
英文摘要:
  Game theory is widely used as a behavioral model for strategic interactions in biology and social science. It is common practice to assume that players quickly converge to an equilibrium, e.g. a Nash equilibrium. This can be studied in terms of best reply dynamics, in which each player myopically uses the best response to her opponent\'s last move. Existing research shows that convergence can be problematic when there are best reply cycles. Here we calculate how typical this is by studying the space of all possible two-player normal form games and counting the frequency of best reply cycles. The two key parameters are the number of moves, which defines how complicated the game is, and the anti-correlation of the payoffs, which determines how competitive it is. We find that as games get more complicated and more competitive, best reply cycles become dominant. The existence of best reply cycles predicts non-convergence of six different learning algorithms that have support from human experiments. Our results imply that for complicated and competitive games equilibrium is typically an unrealistic assumption. Alternatively, if for some reason \"real\" games are special and do not possess cycles, we raise the interesting question of why this should be so.
---
中文摘要:
博弈论在生物学和社会科学中被广泛用作战略互动的行为模型。通常的做法是假设参与者迅速收敛到一个均衡,例如纳什均衡。这可以从最佳回应动力学的角度来研究,在最佳回应动力学中,每个玩家都会对对手的最后一步做出最佳反应。现有研究表明,当存在最佳回复周期时,收敛可能会出现问题。在这里,我们通过研究所有可能的两人正常形式博弈的空间并计算最佳回复周期的频率来计算这是多么典型。这两个关键参数是移动次数,它定义了游戏的复杂程度,以及收益的反相关性,它决定了游戏的竞争程度。我们发现,随着游戏变得越来越复杂,竞争也越来越激烈,最佳回复周期占据主导地位。最佳回复周期的存在预示着六种不同学习算法的不收敛性,这些算法得到了人类实验的支持。我们的结果表明,对于复杂的竞争性博弈,均衡通常是不现实的假设。或者,如果出于某种原因,“真实”游戏是特殊的,并且没有循环,我们会提出一个有趣的问题,即为什么会这样。
---
分类信息:

一级分类:Physics        物理学
二级分类:Physics and Society        物理学与社会
分类描述:Structure, dynamics and collective behavior of societies and groups (human or otherwise). Quantitative analysis of social networks and other complex networks. Physics and engineering of infrastructure and systems of broad societal impact (e.g., energy grids, transportation networks).
社会和团体(人类或其他)的结构、动态和集体行为。社会网络和其他复杂网络的定量分析。具有广泛社会影响的基础设施和系统(如能源网、运输网络)的物理和工程。
--
一级分类:Physics        物理学
二级分类:Adaptation and Self-Organizing Systems        自适应和自组织系统
分类描述:Adaptation, self-organizing systems, statistical physics, fluctuating systems, stochastic processes, interacting particle systems, machine learning
自适应,自组织系统,统计物理,波动系统,随机过程,相互作用粒子系统,机器学习
--
一级分类:Quantitative Finance        数量金融学
二级分类:Economics        经济学
分类描述:q-fin.EC is an alias for econ.GN. Economics, including micro and macro economics, international economics, theory of the firm, labor economics, and other economic topics outside finance
q-fin.ec是econ.gn的别名。经济学,包括微观和宏观经济学、国际经济学、企业理论、劳动经济学和其他金融以外的经济专题
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-5-31 08:56:35
泛型gamesMarco-Pangallo?中的最佳回复结构与均衡收敛性?,1,2,Torsten Heinrich1,2和J.Doyne Farmer1,2,3,4牛津大学牛津马丁学院新经济思想研究所,牛津牛津OX26ED,牛津大学英国数学研究所,牛津OX1 3LP,牛津大学英国计算机科学系,牛津OX1 3QD,英国圣达菲研究所,圣达菲,新墨西哥州87501,美国9月20日,2018年抽象博弈论被广泛用作生物学和社会科学中战略互动的行为模型。通常的做法是假设参与者很快收敛到非均衡,例如纳什均衡。这可以从最佳回应动力学的角度来研究,在最佳回应动力学中,每个玩家都会对对手的最后一步做出最佳反应。现有研究表明,当存在最佳回复周期时,收敛可能会出现问题。在这里,我们通过研究所有可能的两人正态博弈的空间并计算最佳回复周期的频率来计算这是多么典型。这两个关键参数是移动次数,它决定了游戏的复杂程度,以及支付的反相关性,它决定了游戏的竞争程度。我们发现,随着游戏变得越来越复杂,竞争也越来越激烈,最佳回复周期成为主导。最佳回复周期的存在预示着六种不同学习算法的不收敛性,这些算法得到了人类实验的支持。我们的结果表明,对于复杂且竞争激烈的情况,games均衡通常是一个不切实际的假设。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-31 08:56:39
或者,如果出于某种原因,“真实”游戏是特殊的,并且没有循环,我们会提出一个有趣的问题,即为什么会这样。JEL代码:C62、C63、C73、D83。关键词:博弈论,学习,均衡,统计力学。*通讯作者:marco。pangallo@maths.ox.ac.ukCycles反馈回路是自然和社会系统不稳定的共同来源。在这里,我们研究了周期和不稳定性之间的关系,这些关系可以建模为两人游戏。其中包括个体参与者之间的战略互动【1】、进化过程【2】、社会现象,如合作的出现【3】和语言形成【4】、道路和互联网上的拥堵【5】以及许多其他应用。我们引入了一种称之为最佳回复结构的形式主义,以近似的游戏表示来描述不稳定性,其精神类似于考夫曼和马荣基因调控[6]和生态系统稳定性[7]的最终贡献。在博弈论中,不稳定性可以理解为策略未能收敛到某一固定点,如纳什均衡,因为agame是重复进行的[8]。众所周知,在匹配硬币或石头剪刀的游戏中,这种趋同很可能会失败【9、10、11】,在这种游戏中,游戏的最佳回复会形成一个循环(从某种意义上讲,这将在下文中阐明)。对于各种类型的非循环对策[12、13、14、15、16],已经证明了非常普遍的收敛结果。但无环AMES有多典型?非循环游戏是否跨越了现实环境中可能遇到的游戏空间?还是它们很特别?在这里,我们系统地研究了所有可能的两人正态博弈的这个问题。我们用一个插入码来描述游戏的类别,在这个插入码中,我们随机构造支付矩阵,然后在游戏进行时将其固定。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-31 08:56:42
我们的形式主义预测了集合参数变化时的典型收敛频率。我们表明,随着游戏变得(i)更加复杂,即每个玩家的移动次数更大,以及(ii)更具竞争性,即任何给定移动组合对两个玩家的回报是反相关的,最佳回复周期变得可能,收敛通常会失败。例如,有10个movesper玩家,关联度为0.7,非循环游戏只占总数的2.7%。因此,在一般的复杂竞争的games中,均衡收敛通常是一个不现实的假设。虽然研究系统集合的泛型性质是自然科学中的一种常见方法,但在博弈论中却不常见。因此,在更详细地描述我们的贡献以及与文献的关系之前,我们要澄清为什么我们认为这种方法对博弈论有用。罗伯特·梅(RobertMay)[17]在理论生态学中的工作是一个自然的比较点,他使用了一组随机生成的捕食者-猎物相互作用作为一般生态系统的空模型,并表明大型生态系统往往是不稳定的。真正的生态系统不是随机的,而是由进化选择和其他力量塑造的。许多真正的生态系统也存在了很长一段时间,这表明它们实际上是稳定的。这表明,真实的生态系统不是集合中的典型成员,并提出了一个重要问题,即它们到底是如何非典型的,以及为什么它们是稳定的。四十五年后,这仍然是一个活动研究的主题。在这里,我们将同样的方法应用于博弈论,将随机博弈集合作为可表示为博弈的真实世界场景的空模型。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-31 08:56:46
寡头垄断市场中的定价、竞争企业中的创新策略、金融市场中的买卖、拍卖、竞争政党中的选举策略、道路交通和通过互联网发送包裹都是复杂竞争游戏的例子。与生态学相反,从经验的角度来看,它们是否是稳定的,先验上并不清楚:什么时候平衡是一个好的行为模式?这些游戏的规则是设计出来的,不是随机的,但只要它们可以被正常形式的游戏建模,它们都是我们在这里研究的集合的成员。如果复杂且竞争激烈的真实博弈是其集合的典型成员,我们的结果表明,均衡可能是一个很差的近似值。或者,如果人类设计的游戏是典型的,而周期是罕见的,为什么会这样?这可能因情况而异,但如果人性化设计的游戏往往是非典型的,我们的战略冲突必须具有特殊的属性。这是否属实,以及人类设计可能导致非典型行为的原因,尚不明显。如果人类设计的游戏是非典型的,那么这是一个值得进一步研究的有趣问题。为了更好地理解我们的形式主义,请考虑一种最简单的学习算法,即最佳回复动态。在这种算法下,每一位玩家都会对对手的最后一步做出短视的最佳回应。最佳回复动态收敛到吸引子,吸引子可以是固定点、对应的纯策略纳什均衡或周期。Weshow,一个非常简单的衡量最佳回复周期相对于固定点的相对“大小”的方法大致可以预测(R平方>0.75)几种知名且更现实的学习算法(强化学习、实战游戏、复制器动力学、经验加权吸引、k级学习)的非收敛频率。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-31 08:56:49
其中一些学习算法得到了人类实验的支持,并结合了前瞻性的有限理性,这表明我们的结果至少在某种程度上描述了真实玩家的行为。关于学习算法的均衡收敛性质,已有大量的ingame理论文献;即使在入门课程中,最佳答案的作用也得到了广泛认可。这些文献通常在数学上是严格的,并且倾向于在特定类别的游戏中得到精确的结果【12、13、14、15、16】。我们的工作是对这篇文献的补充,因为我们提供了一般游戏的近似结果,并通过大量的数值模拟验证了我们的结果。这使我们有可能研究一些以前没有解决过的问题。例如,我们能够计算在同一个游戏中具有最佳回复周期和固定点的游戏中的收敛概率。一旦我们确定最佳回复结构具有预测价值,我们将确定其如何随移动次数和支付的相关性而变化。我们使用组合方法分析计算微正则系综下不同长度周期的频率。在博弈论中,使用受统计力学启发的方法的想法并不新鲜。然而,虽然现有研究具有纯策略纳什均衡【19、20、21】、混合策略均衡【22、23】和帕累托均衡【24】的量化特性,但我们是第一个量化最佳回复周期的频率和长度的研究。这就直观地解释了为什么在一般的复杂竞争博弈中收敛到均衡会失败【25】,并引入了一种可以在多个方向和不同领域扩展的形式主义。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群