全部版块 我的主页
论坛 经济学人 二区 外文文献专区
1289 74
2022-06-24
英文标题:
《The route to chaos in routing games: When is Price of Anarchy too
  optimistic?》
---
作者:
Thiparat Chotibut, Fryderyk Falniowski, Micha{\\l} Misiurewicz,
  Georgios Piliouras
---
最新提交年份:
2019
---
英文摘要:
  Routing games are amongst the most studied classes of games. Their two most well-known properties are that learning dynamics converge to equilibria and that all equilibria are approximately optimal. In this work, we perform a stress test for these classic results by studying the ubiquitous dynamics, Multiplicative Weights Update, in different classes of congestion games, uncovering intricate non-equilibrium phenomena. As the system demand increases, the learning dynamics go through period-doubling bifurcations, leading to instabilities, chaos and large inefficiencies even in the simplest case of non-atomic routing games with two paths of linear cost where the Price of Anarchy is equal to one.   Starting with this simple class, we show that every system has a carrying capacity, above which it becomes unstable. If the equilibrium flow is a symmetric $50-50\\%$ split, the system exhibits one period-doubling bifurcation. A single periodic attractor of period two replaces the attracting fixed point. Although the Price of Anarchy is equal to one, in the large population limit the time-average social cost for all but a zero measure set of initial conditions converges to its worst possible value. For asymmetric equilibrium flows, increasing the demand eventually forces the system into Li-Yorke chaos with positive topological entropy and periodic orbits of all possible periods. Remarkably, in all non-equilibrating regimes, the time-average flows on the paths converge exactly to the equilibrium flows, a property akin to no-regret learning in zero-sum games. These results are robust. We extend them to routing games with arbitrarily many strategies, polynomial cost functions, non-atomic as well as atomic routing games and heteregenous users. Our results are also applicable to any sequence of shrinking learning rates, e.g., $1/\\sqrt{T}$, by allowing for a dynamically increasing population size.
---
中文摘要:
路由游戏是研究最多的游戏类别之一。它们的两个最著名的性质是,学习动力学收敛到平衡点,并且所有平衡点都近似最优。在这项工作中,我们对这些经典结果进行了压力测试,通过研究不同类别的拥塞博弈中无处不在的动力学、乘性权重更新,揭示了复杂的非均衡现象。随着系统需求的增加,学习动态会经历倍周期分岔,导致不稳定、混乱和效率低下,即使在最简单的情况下,无政府状态的价格等于一的具有两条线性成本路径的非原子路由博弈也是如此。从这个简单的类开始,我们证明每个系统都有一个承载能力,超过这个承载能力,系统就会变得不稳定。如果平衡流是对称的$50-50\\%分裂,则系统表现出一个倍周期分岔。一个周期为2的周期吸引子代替吸引不动点。尽管无政府状态的代价等于1,但在人口众多的情况下,除了零测度初始条件集外,所有初始条件的时间平均社会成本都会收敛到其可能的最差值。对于非对称平衡流,需求的增加最终迫使系统进入具有正拓扑熵和所有可能周期的周期轨道的Li-Yorke混沌。值得注意的是,在所有非平衡状态下,路径上的时间平均流精确收敛于平衡流,这一性质类似于零和博弈中的无遗憾学习。这些结果是可靠的。我们将其推广到具有任意多个策略的路由博弈、多项式代价函数、非原子和原子路由博弈以及异构用户。我们的结果也适用于任何学习率下降的序列,例如,考虑到人口规模的动态增长,1美元/sqrt{T}$。
---
分类信息:

一级分类:Computer Science        计算机科学
二级分类:Computer Science and Game Theory        计算机科学与博弈论
分类描述:Covers all theoretical and applied aspects at the intersection of computer science and game theory, including work in mechanism design, learning in games (which may overlap with Learning), foundations of agent modeling in games (which may overlap with Multiagent systems), coordination, specification and formal methods for non-cooperative computational environments. The area also deals with applications of game theory to areas such as electronic commerce.
涵盖计算机科学和博弈论交叉的所有理论和应用方面,包括机制设计的工作,游戏中的学习(可能与学习重叠),游戏中的agent建模的基础(可能与多agent系统重叠),非合作计算环境的协调、规范和形式化方法。该领域还涉及博弈论在电子商务等领域的应用。
--
一级分类:Economics        经济学
二级分类:General Economics        一般经济学
分类描述:General methodological, applied, and empirical contributions to economics.
对经济学的一般方法、应用和经验贡献。
--
一级分类:Mathematics        数学
二级分类:Dynamical Systems        动力系统
分类描述:Dynamics of differential equations and flows, mechanics, classical few-body problems, iterations, complex dynamics, delayed differential equations
微分方程和流动的动力学,力学,经典的少体问题,迭代,复杂动力学,延迟微分方程
--
一级分类:Physics        物理学
二级分类:Chaotic Dynamics        混沌动力学
分类描述:Dynamical systems, chaos, quantum chaos, topological dynamics, cycle expansions, turbulence, propagation
动力系统,混沌,量子混沌,拓扑动力学,循环展开,湍流,传播
--
一级分类:Physics        物理学
二级分类:Physics and Society        物理学与社会
分类描述:Structure, dynamics and collective behavior of societies and groups (human or otherwise). Quantitative analysis of social networks and other complex networks. Physics and engineering of infrastructure and systems of broad societal impact (e.g., energy grids, transportation networks).
社会和团体(人类或其他)的结构、动态和集体行为。社会网络和其他复杂网络的定量分析。具有广泛社会影响的基础设施和系统(如能源网、运输网络)的物理和工程。
--
一级分类:Quantitative Finance        数量金融学
二级分类:Economics        经济学
分类描述:q-fin.EC is an alias for econ.GN. Economics, including micro and macro economics, international economics, theory of the firm, labor economics, and other economic topics outside finance
q-fin.ec是econ.gn的别名。经济学,包括微观和宏观经济学、国际经济学、企业理论、劳动经济学和其他金融以外的经济专题
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-6-24 02:58:06
路由博弈中的混乱之路:无政府状态的代价何时过于乐观?THIPARAT CHOTIBUT、FRYDERYK FALNIOWSKI、MICHA L MISIUREWICZ和GEORGIOS PILIOURASAbstract。路由游戏是研究最多的游戏类别之一。它们最著名的两个特性是学习动力学收敛到平衡,而等位平衡近似为最优。在这项工作中,我们对这些分类结果进行了压力测试,通过研究拥塞博弈不同类别中普遍存在的动力学、乘性权重更新,揭示了复杂的非平衡现象。随着系统需求的增加,学习动态会经历倍周期分岔,导致不稳定性、混沌和巨大的效率,即使在最简单的情况下,非原子路由博弈具有两条线性成本路径,其中无政府状态的价格等于一。从这个简单的类开始,我们证明每个系统都有一个承载能力,超过这个承载能力,系统就会变得不稳定。如果平衡流为对称50-50%分裂时,系统表现出单倍周期分岔。一个周期为2的周期吸引子取代了吸引固定点。尽管无政府状态的代价等于1,但在大人口限制下,除了零测度初始条件集外,所有初始条件的时间平均社会成本都会收敛到其可能的最差值。对于非对称平衡流,需求的增加最终迫使系统进入具有正拓扑熵和所有可能周期的周期轨道的Li-Yorke混沌。值得注意的是,在所有非平衡状态下,路径上的时间平均流恰好收敛到平衡流,这是零和博弈中无遗憾学习的一个特性。这些结果是可靠的。我们将其推广到具有任意多个策略的路由博弈、多项式代价函数、非原子和原子路由博弈以及异构用户。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 02:58:10
我们的结果也适用于任何学习率下降的序列,例如,1/√T,允许动态增加人口规模。图1:。如果两条路线之间的平衡流是对称的(b=0.5),则总需求量N较大会导致周期2的极限环。在任何具有不对称平衡分裂(b 6=0.5)的博弈中,混沌都会出现在大N处。有关详细讨论,请参见图2.2 T.CHOTIBUT、F.FALNIOWSKI、M.MISIUREWICZ和G.PILIOURAS1。简介拥塞和路由博弈[72]是ingame理论中研究最为深入的一类博弈。拥塞博弈同构于潜在博弈[56],是一类新的博弈,其中已知各种学习动态会收敛到纳什均衡[9、29、32、34、44、45]。证明收敛到平衡点通常利用势函数的存在性,该势函数作为学习动力学的(强)李亚普诺夫函数;当系统失去平衡时,该函数严格递减。拥挤博弈在无ZF价格研究中也起着关键作用[10、21、26、35、46、75]。无ZF状态价格(PoA)定义为worstNash均衡的社会成本与最优社会成本的比率。无ZF状态的代价很小,这意味着所有的纳什均衡都是接近最优的,因此任何均衡的学习动态都有助于达到近似最优的系统性能。无ZF价格研究的一个标志是,为拥塞博弈制定了严格的无ZF价格界限,这与网络拓扑或用户数量无关。具体而言,在线性成本函数的原型假设下,非原子主体(其中每个主体控制一个极小的流量)的无ZF状态价格为4/3【75】。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 02:58:13
在原子情况下(每个代理控制一个离散的流量单位),Archy的价格最多为5/2[21],小型网络支持提供严格的下限。此外,拥塞博弈为无政府状态研究的最新发展铺平了道路,扩展了我们对系统性能的理解,甚至是对非平衡动力学的理解。Roughgarden[73]表明,无政府状态结果的大部分代价可以在一个称为(λ,u)-平滑的共同框架中组织。对于满足这一性质的博弈类,如拥塞博弈,最坏情况下纳什均衡的无政府边界价格立即转移到后悔最小化算法的最坏情况实例。据说,(在线)算法可以最大限度地减少遗憾,只要其时间平均性能大致与事后最佳固定动作的性能一样好。这类算法中最普遍的成员可以说是乘法加权日期(MWU)[5]。上述无政府状态结果的代价很容易适用于任何学习动态或任何战略游戏序列,只要算法实现短时平均后悔。在拥塞博弈的情况下,即使在学习不平衡的情况下,也能渐近保证接近最优的时间平均性能,然而,正如我们在第8节中讨论的那样,收敛速度慢,这降低了此类结果在某些感兴趣的应用中的适用性,包括具有多个代理的拥塞博弈。所有这些积极的结果都激励着越来越多的人实现更高的效率保证。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 02:58:16
无政府状态的代价有多接近1?例如,在线性拥挤游戏中,最终的正确答案到底是什么?它是原子模型所建议的5/2,还是4/3结合的非原子结合更好?在多项式代价函数的情况下,这些预测之间的差距随着多项式的阶数呈指数级增长,这使得这个问题更加紧迫。在最近的一项发展中,[31]认为,即使代理是原子的,只要代理的数量N很大,原子拥塞游戏的行为近似于非原子游戏;因此,4/3是正确的界限。也就是说,更小的非原子束缚毕竟是正确的。随后出现了一系列相关结果[22-24],表明在需求量较大的假设下,无政府状态的价格有很强的界限。原子和非原子拥塞游戏之间有什么联系?让我们考虑一下最简单的拥塞博弈示例。具有两种策略和两个代理的游戏,其中每个策略的成本/延迟等于其负载。路由博弈中最坏的纳什路径3该博弈的均衡使得两个代理一致随机选择策略。每个代理的预期成本为3/2,即,由于其自身的负载,成本等于1,由于采用与其他代理相同的策略的可能性为50%,因此预期额外成本为1/2。另一方面,在最佳状态下,每个代理选择不同的策略ata成本为1。因此,这场游戏的无政府状态代价是三分之二。假设现在我们将代理的数量从2个增加到N个。最坏的均衡仍然是每个代理以(N)的预期成本均匀随机地选择策略-1) /2+1=(N+1)/2。最优配置将两个代理进行决定性的、平等的拆分,每个代理的成本为N/2。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 02:58:19
无政府状态的代价是1+1/N,随着N的增加,会收敛到1。事实上,随着人口规模的增长,原子博弈更容易由其有效的非原子对应物来描述,具有连续的用户群,以及在两种策略之间均衡分配总需求N的独特均衡。因此,平衡实际上是最优的。然而,这种巨大的需求如何影响动态?非正式元定理:我们分析了路由/拥塞博弈中在不同设置范围及其组合(两条/多条路径、非原子/原子、线性/多项式等)下的MWU。给定任何这样的游戏G和任意的小学习率(步长), 我们证明了存在一个系统容量N(G,) 因此,如果总需求超过该阈值,则系统是不稳定的,具有复杂的非平衡行为。证明了周期行为和混沌行为,并给出了它们出现的条件的形式保证。尽管非平衡状态具有这种不可预测性,但时间平均成本/流量表现出规律性,对于线性成本,则趋于平衡。然而,由于时间平均成本可以任意高,即使对于所有均衡都是最优的简单博弈,由此产生的非均衡流的差异也会导致效率的提高。不稳定背后的直觉:为了建立不稳定为什么会出现的直觉,让我们用两种策略重新审视这个简单的例子,并让我们考虑一个连续/大量的用户根据学习动态更新他们的策略,例如具有步长的MWU. 在任何非均衡初始条件下,过度拥挤策略上的代理都有很强的迁移动机。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群