全部版块 我的主页
论坛 经济学人 二区 外文文献专区
849 34
2022-06-01
英文标题:
《A Mean Field Competition》
---
作者:
Marcel Nutz, Yuchong Zhang
---
最新提交年份:
2017
---
英文摘要:
  We introduce a mean field game with rank-based reward: competing agents optimize their effort to achieve a goal, are ranked according to their completion time, and paid a reward based on their relative rank. First, we propose a tractable Poissonian model in which we can describe the optimal effort for a given reward scheme. Second, we study the principal--agent problem of designing an optimal reward scheme. A surprising, explicit design is found to minimize the time until a given fraction of the population has reached the goal.
---
中文摘要:
我们引入了一个基于等级奖励的平均场游戏:竞争代理优化其努力以实现目标,根据完成时间进行排名,并根据其相对等级支付奖励。首先,我们提出了一个易于处理的泊松模型,在该模型中我们可以描述给定奖励方案的最优努力。其次,我们研究了设计最优报酬方案的委托代理问题。研究发现,一种令人惊讶的显式设计可以最大限度地缩短人口达到目标所需的时间。
---
分类信息:

一级分类:Mathematics        数学
二级分类:Optimization and Control        优化与控制
分类描述:Operations research, linear programming, control theory, systems theory, optimal control, game theory
运筹学,线性规划,控制论,系统论,最优控制,博弈论
--
一级分类:Mathematics        数学
二级分类:Probability        概率
分类描述:Theory and applications of probability and stochastic processes: e.g. central limit theorems, large deviations, stochastic differential equations, models from statistical mechanics, queuing theory
概率论与随机过程的理论与应用:例如中心极限定理,大偏差,随机微分方程,统计力学模型,排队论
--
一级分类:Quantitative Finance        数量金融学
二级分类:Economics        经济学
分类描述:q-fin.EC is an alias for econ.GN. Economics, including micro and macro economics, international economics, theory of the firm, labor economics, and other economic topics outside finance
q-fin.ec是econ.gn的别名。经济学,包括微观和宏观经济学、国际经济学、企业理论、劳动经济学和其他金融以外的经济专题
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-6-1 05:07:02
平均场比赛Marcel Nutz*张宇冲+2017年8月7日摘要我们介绍了一种基于等级奖励的平均场游戏:竞争代理优化其工作以实现目标,根据完成时间进行排名,并根据相对人的能力支付奖励。首先,我们提出了一个易于处理的泊松模型,在该模型中,我们可以描述给定奖励方案的最佳效果。其次,我们研究了设计最优报酬方案的委托代理问题。令人惊讶的是,显式设计被发现可以最大限度地缩短达到目标所需的时间。平均场博弈;基于等级的奖励;最优合同;研发竞赛MS 2010主题分类91A13;91B40;本文介绍了两个博弈论问题。第一种是一种平均场游戏,有很多玩家竞争获得阿雷沃德。第二个问题是委托代理问题,其中委托人与这些代理人相互作用;也就是说,负责人的目标是向不同的级别分配一个给定的预算,以便尽可能缩短代理完成任务的时间。让我们把代理商想象成独立的研究团队,试图在同一领域开发成果或产品。根据下文详述的有关动态研究与开发(dynamicresearch and development,R&D)的文献,获得的结果将被建模为一个二进制事件。在任何时间t,每个代理选择一个研究函数λ,为其支付二次瞬时成本cλ,其中c>0被假定为常数,以便进行介绍。在泊松分布中*哥伦比亚大学统计与数学系,mnutz@columbia.edu.阿尔弗雷德·P·斯隆奖学金和NSF拨款DMS-1512900支持的研究+哥伦比亚大学统计系,yz2915@columbia.edu.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 05:07:05
NSF资助的研究DMS-1714607。时尚,代理人在小时间间隔内达到目标的概率t由λ给出t+o(t) ;在研发文献中,λ有时被解释为私人知识的积累,其目标是实现冷漠。根据代理的完成时间和paida奖励R(R)对等级R进行排序,其中奖励方案R是给定的递减函数。在任何时候,代理都会观察已经完成任务的玩家的分数ρ(t),因此R的哪一部分仍然可用;更准确地说,代理使用反馈控制λ(ρ(t))。这种基于等级的代理优化问题耦合是平均场交互的非标准示例。我们将证明,在给定R的情况下,当代理优化报酬负成本的期望时,该博弈具有纳什均衡。事实上,这种设置非常容易处理:定理2.2提供了平衡最优控制λ的显式公式*和代理的价值函数。这些数量与成本c无关,在本文正文中,成本c也允许取决于状态ρ(t),以建模成本可能随着更多结果的可用而减少。第二个问题建立在第一个问题之上:正如我们所看到的,任何奖励方案R都会导致代理人之间的独特平衡,我们可以研究希望推进研究的管理者或决策者的问题。更准确地说,我们的目标是将时间T最小化*直到阿吉文一部分人完成任务。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 05:07:09
原则上有固定的奖励预算B=RR(r)dr,但可以选择递减函数r的形状;也就是说,给每个等级分配多少奖励。令人惊讶的是,委托人的优化问题有一个明确但非平凡的解(定理3.1):R*(r) =BC′√2.- r+对数(1+√2.- α)(1 -√2.- r) (1)-√2.- α)(1 +√2.- r)[0,α](r),其中C′是一个常数,使得预算约束饱和。如图1所示,此函数有两个主要特性。第一个是r=α时的不连续性:相当一部分奖励给了las t少数相关代理,但最好是对α之后的级别支付零奖励。尽管激励最后一批完成α分数的代理人显然很重要,但这些代理人并没有因为他们可能错过了奖励级别而感到气馁。第二个特征是R的形状*在[0,α]上。先验地讲,与向第一个α级支付相同金额的报酬相比,提供严格递减的报酬是否更好,甚至可能并不明显。结果是R*正在减少,即使不是很多,而更多的过度减少和增加在整个论文中都是从非严格意义上理解的。0 0.2 0.4 0.6 0.8 1r0.51.52.53.54.5R*(r)最优报酬=0.25=0.5=0.750 0.2 0.4 0.6 0.8 1r0.51.5*(r)平衡努力=0.25=0.5=0.750 0.5 1 1.5 2.5 3 3.5t0.10.20.30.40.50.60.70.8(t)平衡状态=0.25=0.5=0.75图1:最优报酬方案r*以及相应的平衡流λ*以及三个不同切割值α的状态过程ρ,其中B=1和c≡ 1.为凹面。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 05:07:11
因此,在游戏后期,两个等距等级之间的报酬差异会增加,这显然是为了激励剩下的代理选择更高的报酬,如图1的第二个面板所示。虽然用连续的代理制定游戏很容易直接得到我们的主要结果,但平均场游戏的一个更基本的公正性是研究一个N人的游戏→ ∞. 事实上,weestablish证明,我们这两个问题的N-player版本有着独特的解决方案,尽管比平均场的情况要不那么明确。我们证明了N人均衡收敛于平均场极限;也就是说,如果给定的奖励方案收敛,则值函数和最优反馈控制收敛(定理5.1)。此外,委托人的最优奖励方案和相应的预期完成时间收敛(定理5.3)。有限元分析还允许我们研究在平均场极限下无法观察到的规模效应,因此在大型人口游戏中很少解决。特别是,我们将在第4.3节中观察到,人口规模的增加会对主要因素产生不利影响:最小预期完成时间f或固定目标比例α以N为单位增加。我们的许多结果关键性地使用了我们模型中可以获得的显式或半显式公式;事实上,我们的大部分工作都是为了找到一个易于处理的环境。另一方面,人们可能会怀疑结果的定性特征,特别是最优奖励方案的形状R*, 即使竞争的精确机制不同,也会是类似的。目前,我们似乎没有解决这个问题的工具,因此这仍然是未来研究的一个有趣方向。1.1文学动态竞争(也称种族)是经济学文献中的经典。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 05:07:15
与我们的论文相关的早期参考文献是Reinganum[30],它讨论了研发和专利保护的N人动态博弈。奖励是在固定的时间范围内支付的,并研究了两个案例:要么只有排名第一的玩家获得奖励(完美的专利保护),要么随后的排名获得正的、较小的奖励;然而,仅考虑对所有“模仿者”进行身份奖励的情况。Malueg和Tsutsui【26】以代表研究项目难度变化的危险率来扩展Reinganum的设置,我们通过使用依赖于国家的成本来模拟公众知识的增加如何影响项目,将这一方面不同地纳入其中。Harris和Vickers【17】以及Grossmanand Shapiro【15】专注于多阶段2人游戏中代理人之间的战略互动。这一领域最近的一项工作是Cao【6】,它研究了【17】中模型的连续时间、连续状态版本。本文献中的更多参考文献,请参考[6,26]。Lasry和Lions【22、23、24】以及Huang、Malhamé和Caines【19、20】引入了平均场博弈,以研究限制制度下的纳什均衡,其中参与者的数量趋于一致,并通过私人国家的经验分布进行互动;我们参考了盖恩特、莱斯利和狮子队【16】、本苏桑、弗雷西和亚姆【4】以及卡莫纳和德拉鲁【8、9】了解平均场比赛的背景。由于单个参与者对总分布的影响可以忽略不计,因此,找到纳什均衡将简化为解决代表性参与者在固定环境下的随机优化问题,以及一致性条件。这可以通过制定一个具有连续玩家的游戏,并证明它是N人游戏的极限来严格证明。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群