全部版块 我的主页
论坛 经济学人 二区 外文文献专区
2100 71
2022-05-07
英文标题:
《Berk-Nash Equilibrium: A Framework for Modeling Agents with Misspecified
  Models》
---
作者:
Ignacio Esponda and Demian Pouzo
---
最新提交年份:
2019
---
英文摘要:
  We develop an equilibrium framework that relaxes the standard assumption that people have a correctly-specified view of their environment. Each player is characterized by a (possibly misspecified) subjective model, which describes the set of feasible beliefs over payoff-relevant consequences as a function of actions. We introduce the notion of a Berk-Nash equilibrium: Each player follows a strategy that is optimal given her belief, and her belief is restricted to be the best fit among the set of beliefs she considers possible. The notion of best fit is formalized in terms of minimizing the Kullback-Leibler divergence, which is endogenous and depends on the equilibrium strategy profile. Standard solution concepts such as Nash equilibrium and self-confirming equilibrium constitute special cases where players have correctly-specified models. We provide a learning foundation for Berk-Nash equilibrium by extending and combining results from the statistics literature on misspecified learning and the economics literature on learning in games.
---
中文摘要:
我们开发了一个平衡框架,放松了人们对环境有正确特定看法的标准假设。每个参与者都有一个(可能是错误指定的)主观模型,该模型描述了作为行为函数的与回报相关的结果的一组可行信念。我们引入了伯克-纳什均衡的概念:每个参与者都遵循一个给定其信念的最优策略,并且她的信念被限制为她认为可能的信念集合中的最佳匹配。最佳拟合的概念形式化为最小化Kullback-Leibler发散,这是内生的,取决于均衡策略。标准解的概念,如纳什均衡和自我确认均衡,构成了特殊情况下,玩家有正确指定的模型。我们通过扩展和结合关于错误指定学习的统计文献和关于博弈学习的经济学文献的结果,为伯克-纳什均衡提供了学习基础。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Economics        经济学
分类描述:q-fin.EC is an alias for econ.GN. Economics, including micro and macro economics, international economics, theory of the firm, labor economics, and other economic topics outside finance
q-fin.ec是econ.gn的别名。经济学,包括微观和宏观经济学、国际经济学、企业理论、劳动经济学和其他金融以外的经济专题
--
一级分类:Computer Science        计算机科学
二级分类:Computer Science and Game Theory        计算机科学与博弈论
分类描述:Covers all theoretical and applied aspects at the intersection of computer science and game theory, including work in mechanism design, learning in games (which may overlap with Learning), foundations of agent modeling in games (which may overlap with Multiagent systems), coordination, specification and formal methods for non-cooperative computational environments. The area also deals with applications of game theory to areas such as electronic commerce.
涵盖计算机科学和博弈论交叉的所有理论和应用方面,包括机制设计的工作,游戏中的学习(可能与学习重叠),游戏中的agent建模的基础(可能与多agent系统重叠),非合作计算环境的协调、规范和形式化方法。该领域还涉及博弈论在电子商务等领域的应用。
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-5-7 02:58:58
伯克-纳什均衡:一个用错误模型对代理人建模的框架*Ignacio Esponda Demian Pouzo(WUSTL)(加州大学伯克利分校)2019年11月22日摘要我们开发了一个平衡框架,放松了人们对环境有正确特定看法的标准假设。每一个玩家都有一个(可能是误判的)主观模型,该模型描述了作为行动函数的与支付相关的后果的一组可行信念。我们引入了伯克-纳什均衡的概念:每个参与者都遵循一个策略,该策略在给定其信念的情况下是最优的,并且她的信念被限制为她认为可能的一组信念中的最佳。最佳函数的概念形式化为最小化Kullback-Leibler发散,这是内在的,取决于均衡策略。如纳什均衡和纳什均衡等标准均衡。我们通过扩展和结合关于特定错误学习的统计文献和关于游戏学习的经济学文献的结果,为伯克-纳什均衡提供了学习基础。*我们感谢弗拉基米尔·阿斯里扬、皮耶保洛·巴蒂加利、拉里·布鲁姆、亚伦·博多·克里德、西尔瓦恩卡桑、埃米利奥·埃斯皮诺、埃里克·埃斯特、德鲁·福登伯格、尤里·戈罗德尼琴科、斯蒂芬·劳尔曼、娜塔莉亚·拉扎蒂、克里斯托夫·马达雷斯、马修·拉宾、阿里尔·鲁宾斯坦、乔尔·索贝尔、约尔格·斯托耶、几位研讨会参与者,尤其是一位联合编辑和四位匿名裁判,感谢他们提供了非常有益的评论。Esponda:圣路易斯华盛顿大学奥林商学院,布鲁金斯大道1号,圣路易斯大学1133校区信箱。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 02:59:01
路易,密苏里州63130,iesponda@wustl.edu; 普佐:加州大学伯克利分校经济系,地址:加利福尼亚州伯克利市埃文斯厅530-1号,邮编:94720,dpouzo@econ.berkeley.edu.1引言大多数经济学家认识到,他们模型背后的简化假设往往是错误的。但是,尽管认识到模型可能存在误判,但标准方法(下文指出的例外情况除外)假设经济机构对其环境有正确的特定看法。我们提出了一个平衡框架,放松了这个标准假设,并允许建模者假设经济主体对自己的世界有主观的、可能不正确的看法。一个客观的游戏代表了代理(或玩家,在多个交互代理的情况下)所面临的真实环境。相关状态和私人观测到的信号来自客观概率分布。每个玩家观察herown的私人信号,然后玩家同时选择动作。行动和实现状态决定结果,结果决定回报。此外,每个参与者都有一个主观模型,代表自己对环境的看法。从形式上讲,主观模型是一组概率分布,这些概率分布是玩家自身行为和信息的函数。重要的是,我们允许一个或多个参与者的主观模型被误判,这意味着主观分布集不包括真实的客观分布。例如,消费者可能会认为非线性价格表是线性的,因此对平均价格而非边际价格做出反应。或者,交易者可能没有意识到贸易的价值在一定程度上取决于贸易条件。伯克-纳什均衡是一种策略,即对于每个参与者,其主观模型满足两个条件时,存在一个信念和支持。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 02:59:04
首先,考虑到信念,策略是最优的。其次,该信念将概率1置于主观分布的集合上,而不是与真实分布“最接近”的结果,其中真实分布由客观博弈和实际策略决定。“最近”的概念由加权版的库尔贝克-莱布勒散度(也称为相对熵)给出。伯克-纳什均衡包括一个共同框架中的标准和有界理性解概念,如纳什、自我确认(例如,巴蒂加利(1987)、福登伯格和莱文(1993a)、德克尔等人(2004))、完全诅咒(埃斯特和拉宾,2005)和基于类比的期望均衡(杰希尔(2005)、杰希尔和科斯勒(2008))。例如,假设游戏被正确指定(即,每个玩家的先验支持包含真实分布),并且游戏被强烈识别(即,存在唯一的分布,无论是否正确,都与观察到的数据相匹配)。然后伯克-纳什均衡等价于纳什均衡。如果放弃了强烈的认同假设,那么伯克-纳什就是一个自我确认的均衡。除了统一以前的工作之外,我们的框架还为扩展以前的案例和探索新类型的错误提供了一种系统的方法。我们通过研究一个由固定数量的玩家反复玩目标游戏的动态设置,为伯克-纳什均衡(以及使用库尔巴克莱布尔散度作为“距离”的度量)提供了基础。每个玩家都相信环境是静止的,并从一个优先于她的主观模型开始。在每个阶段,玩家根据观察到的结果,根据贝叶斯规则更新他们的信念。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 02:59:07
主要目的是描述当玩家表现最佳但使用可能错误的主观模型学习时的限制行为。主要结果是,如果玩家的行为收敛,那么它收敛到伯克纳什均衡。相反的结果表明,对于某些初始(非教条主义者)先验,我们可以收敛到博弈的任何伯克-纳什均衡,但这一结果并不成立。但是,我们放松了参与者精确优化的假设,从而获得了一个正的收敛结果。对于任何给定的Berk-Nash均衡,我们证明,如果代理近视并做出渐近最优选择(即,优化错误随时间消失),就会收敛到该均衡。长期以来,人们一直对研究持有错误世界观的代理人的行为感兴趣。例子来自不同的领域,包括工业组织、机制设计、信息经济学、宏观经济学、心理学和经济学(例如,阿罗和格林(1973)、基尔曼(1975)、索贝尔(1984)、卡格尔和莱文(1986)、尼亚尔科(1991)、萨金特(1999)、拉宾(2002)),尽管通常没有明确提到错误的学习。然而,大多数文献侧重于特定环境,在开发统一框架方面几乎没有进展。我们的处理方法既有“理性”的方法,也有“有限理性”的方法,因此强调,对不特定参与者的行为建模并不构成对标准框架的重大偏离。Arrow and Green(1973)提供了一种通用的处理方法,并区分了客观游戏和主观游戏。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 02:59:10
不过,他们的框架比我们的框架在允许玩家出现的错误类型方面更具限制性。在多个代理的情况下,环境不需要是静止的,因此我们忽略了重复的游戏考虑,玩家会考虑他们的行为如何影响其他人的未来游戏。在第5节中,我们讨论了对具有连续代理的种群模型的扩展。此外,它们不能建立存在或为平衡提供学习基础。最近,Spiegler(2014)引入了一个框架,该框架使用贝叶斯网络在不完全理解相关结构的情况下分析决策。我们的论文还与bandit(如Rothschild(1974)、McLennan(1984)、Easley和Kiefer(1988))和自我确认平衡(SCE)文献有关,这些文献强调,如果实验成本高昂,代理人可能会以错误的信念告终。我们也允许由于反馈不足而导致信念错误,但我们的主要贡献是允许错误的学习。当玩家有错误的模型时,信念可能是不正确的,并且内在地依赖于自己的行为,即使有持续的实验;因此,需要一个平衡框架来描述日常状态行为,即使是在单代理环境中。从技术角度来看,我们扩展并结合了两篇文献的结果。首先,均衡是学习过程的结果这一观点来源于有关游戏学习的文献。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群