全部版块 我的主页
论坛 经济学人 二区 外文文献专区
2022-6-24 02:59:38
为了更深入地讨论这些问题,我们请读者参考布兰查德(Blanchard)[11]、格拉斯纳(Glasner)和叶(Ye)[40]、李(Li)和叶(Ye)[49]以及吕特(Ruette)的书(76)]所做的出色调查。fa的熵,双正:在讨论之后,我们可以展示fa,b的熵是如何表现的。对于任何区间映射,我们有以下内容:定理6.2([54])。对于区间映射f,以下断言是等价的:i)f有一个周期不是2的幂的周期点,ii)f的拓扑熵为正。因此,定理6.2结合推论3.9加强了后者。推论6.3。如果b∈ (0,1)\\{1/2},则存在a>abthen fa,所有周期的Bhasperic轨道,正拓扑熵和Li-Yorke混沌。计算熵:一般来说,计算熵不是一件容易的事。然而,在区间映射的上下文中,拓扑熵可以非常直接地计算出来——它等于fn的最小单调子区间数的指数增长率。定理6.4(【55】)。设f是分段单调区间映射,对于所有n≥ 1,设Cn为fn的单调划分的最小基数。Thenh(f)=limn→∞nlog cn=infn≥1nlog中国。此外,对于分段单调区间映射,在映射为单调的区间上,用任何分区计算的熵就是拓扑熵【2,Prop.4.2.3】。这为我们从博弈论的角度理解fa,B的正熵意味着什么提供了一种方法。对于a>b(1-b) 映射fa,bis是一个双峰映射,具有两个临界点xl,xr(定义于(10))和a(唯一于(0,1))平衡b∈ (xl,xr)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 02:59:41
因为x是选择第一种策略的概率,所以我们可以说,如果x<xlor x>xr,那么其中一种策略被过度使用,如果x接近b,那么x∈ [xl,xr],则系统大致处于平衡状态。现在,我们可以把一个分区{[0,xl),[xl,xr],(xr,1]}分成三个区间,在这三个区间上,fa,bismonentine。对于每个x∈ [0,1]和每n≥ 1如果系统大致处于平衡状态,即如果fna,b(x),我们为x:x[n]=A的n-迭代编码三个事件∈[xl,xr];x【n】=B如果第二种策略被过度使用,即fna,B(x)∈ [0,xl)和x[n]=到岸价第一种策略被过度使用,fna,b(x)∈ (xr,1)。对于每个x∈ [0,1]我们得到了字母表{A,B,C}上的20个T.CHOTIBUT,F.FALNIOWSKI,M.MISIUREWICZ和G.PILIOURASin有限序列x。现在,h(fa,b)>0的事实意味着长度n的不同块的数量,我们可以通过观察以这种方式生成的不同x来观察,将呈指数增长。6.2. 不变测度和遍历定理。我们还可以根据概率空间上定义的保测度变换讨论离散动力系统。这种方法不仅可以处理纯粹的数学概念,而且可以处理自然界中的物理现象。本小节专门讨论不变测度、绝对连续测度和遍历理论中最基本的思想——Birkhoff遍历定理,该定理指出,概率为1时,沿遍历变换轨道的函数平均值等于给定函数的积分。定义。设(X,B,u)为概率空间,f:X 7→ X是一个可测量的地图。如果u(f),则度量u是f不变的(映射f是u不变的-1E)=u(E)对于每个E∈ B、 对于f-不变测度u,如果E∈ B满意度f-1E=Eif且仅当u(E)=0或1时。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 02:59:45
度量u相对于Lebesguemeasure是绝对连续的当且仅当对于每个集合E∈ 零Lebesgue度量值的Bu(E)=0。我们现在可以陈述遍历定理。定理6.5(Birkhoff遍历定理)。设(X,B,u)为概率空间。如果f是u不变的,g是可积的,则→∞nn型-1Xk=0g(fk(x))=g*(x) 对于一些g*∈ L(X,u)和g*(f(x))=克*(x) 对于几乎每个x。此外,如果f为isergodic,则g为*是常数和极限→∞nn型-1Xk=0g(fk(x))=ZXg du几乎每x一个。最后,为什么绝对连续不变度量很重要?基于计算机的研究被广泛用于深入了解混沌现象的动力学。然而,在解释计算机模拟时必须谨慎。通常,混沌系统表现出多个遍历不变测度[38];因此,区分实际轨道显示的测量值和计算机模拟获得的轨道测量值非常重要,这可能会由于累积的计算舍入误差而有所不同。但如果存在关于Lebesgue测度的绝对连续测度,那么计算机模拟将产生我们期望的测度[16]。因此,理论测量和计算测量在这项工作中是一致的。7、相关工作博弈论中的学习动力学研究历史悠久,可以追溯到布朗(Brown)[17]和罗宾逊(Robinson)[71]关于零和游戏中的实际游戏的研究,该研究紧随着诺依曼(Dvon Neumann)关于零和游戏的开创性工作[88,89]。一组具有代表性的参考书如下:塞萨·比安奇(Cesa Bianchi)和卢戈西(Lugoisi)[18],福登堡(Fudenberg)和莱文(Levine)[36],霍夫鲍兰(Hoffauerand Sigmund)[41],桑多姆(Sandholm)[78],塞尔古(Sergiu)和安德烈(Andreu)[80],杨(Young)[。路由游戏中的混乱之路是21个主要的先兆。Palaiopanos等人[62]提出了拥塞博弈中乘性权重更新(MWU)学习产生的混沌动力学研究。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 02:59:48
他们建立了具有线性代价函数的两个主体和两个环节的原子拥挤对策中周期为2的吸引极限环和Li-Yorke混沌的存在性。博弈的对称性(即对称均衡的存在,其中双方以0.5的概率选择每条路径)导致了周期2的极限环。他们还研究了一个具有不对称均衡的游戏的特定实例,如果代理以足够大的学习率(步长)调整策略,MWU会导致Yorke混乱 (相当地,如果代理使用固定的学习率 但他们的成本规模很大)。不久之后,Chotibut等人[20]确定,如果均衡是不对称的,则Li-Yorke-chaosis普遍存在于具有两个平行链接和线性代价函数的任何两代理原子拥塞博弈中。也就是说,在任何具有非对称均衡的2×2拥塞博弈中,当成本函数增长到足够大时,Li-Yorke混沌就会出现,但前提是初始条件是对称的,即两个代理从相同的初始条件开始。此外,[20]首次确定,尽管存在周期性或混沌行为,但两个代理的时间平均策略始终精确收敛到内部纳什均衡。虽然我们目前的工作利用了[20]中的技术,但它还研究了混沌的其他定义,例如正拓扑熵,研究非原子拥塞博弈,并将结果与无政府状态和系统效率分析的价格相关联。此外,尽管在[20,62]中,混沌行为包含在二维空间的一维变子空间中,但在本文中,系统的维数已经等于1,因此混沌结果与整体状态空间相关。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 02:59:51
最后,在附录中,我们提供了在具有多个自由度的更大、更复杂的拥塞博弈中学习动态的初步结果。博弈论中的混沌。在完全理性假设下,纳什均衡是博弈论的核心概念,这并不奇怪。然而,在现实中,玩家通常不会遵循纳什均衡策略进行游戏。Satoet等人的开创性工作【79】通过计算系统的Lyapunov指数分析表明,即使是在一个简单的两人游戏中的岩石纸剪刀,复制器动力学(MWU的连续时间模拟)也会导致混沌,使平衡策略无法实现。对于具有大量可用策略的两人博弈(复杂博弈),Gallaand Farmer[37]认为,经验加权吸引(EWA)学习,一种学习动力学的行为经济学模型,在大参数空间中也表现出混沌行为。正如最近的后续研究所表明的那样,这些混沌动力学的普遍存在也持续存在于许多玩家的游戏中【77】。因此,仔细的研究表明,许多游戏(小游戏或大游戏)中存在着复杂的行为景观,目前没有单一的理论框架适用。Sparrow等人【83】和van Strien and Sparrow【87】证明了一类3x3游戏的实际播放学习动力学,包括Shapley游戏和zero-sumdynamics,具有丰富的周期和混沌行为。Cheung和Piliouras【19】证明了许多在线学习算法,包括MWU,当应用于零和博弈时,步长恒定的是Lyapunov混沌。最后,Pangallo等人【64】通过实验证明,强化学习的一种变体,即经验加权吸引(EWA),会导致具有负相关支付的两个代理博弈中的极限环和高维混沌。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 02:59:54
这有力地表明,混沌、非平衡的结果可以进一步推广到零和对策的其他变体。22 T.CHOTIBUT、F.FALNIOWSKI、M.MISIUREWICZ和G.PILIOURASOther近期博弈论中的非均衡现象。近年来,(算法)博弈论界产生了一些非均衡结果。Daskalakiseet al.(27)表明,在一个特定的c3×3游戏中,MWU即使在时间平均意义上也不会收敛。Kleinberg等人[43]在2×2×2博弈中建立了复制子动力学的非收敛动力学,结果表明,系统社会福利收敛到支配所有纳什均衡的状态。Ostrovski和van Strien【61】分析了3×3游戏中的连续时间竞争,并类似地表明,动态支配着绩效纳什均衡。我们的结果为这一方向增添了新的一章,提供了对非原子拥挤博弈中MWU产生的非均衡现象的详细理解,以及它们对后悔和社会成本的重要影响。在进化博弈论背景下,通常研究连续时变的WU(复制子动力学),许多非收敛结果是已知的,但通常仅限于小博弈[78]。Piliouras和Shamma【70】以及Piliouras等人【68】表明,(网络)零和游戏中的复制子动力学表现出一种特殊类型的重复行为,称为庞加莱复发。最近,Mertikopoulos等人[53]证明了Poincar'e递归也出现在一类更一般的连续时间动力学中,称为跟随正则化领导者(FTRL)。Mai等人[52]建立了复制子的递归结果扩展到动态演化的零和博弈。复制子动态的完美周期(即循环)行为可能出现在团队竞争中【69】以及网络竞争中【57】。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 02:59:57
这一类的作品结合了体积守恒和运动常数的存在(“能量守恒”)等论点,以显示循环或重复的行为。Pangallo等人[63]根据经验确定了游戏中大量学习动态中周期和更普遍的非平衡行为的出现,并显示了它们的行为与更简单的最佳反应动态行为之间的相关性。[65]中发展了complexlearning动力学的极限行为和更好的响应动力学之间的一些形式联系。游戏动力学如物理学。最近,Bailey和Piliouras【8】在博弈论、在线优化和经典物理学中普遍存在的一类系统(称为哈密顿动力学)之间建立了一种稳健的联系,哈密顿动力学自然表现出守恒定律。对于离散时间动力学,如MWU或梯度下降,系统轨迹是连续动力学的一阶近似值;守恒定律和循环不再成立。相反,正如Bailey和Piliouras【6】所示,我们得到了边界的“能量”增加和发散,以及零和博弈中的体积膨胀和Lyapunov混沌,如Cheung和Piliouras【19】所示。尽管存在这种发散、混沌的行为,步长固定的梯度下降在零和博弈中仍有消失的遗憾【7】。到目前为止,还不清楚哈密顿动力学的联系可以推广到什么程度;然而,Ostrovski和van Strien[60]考虑了一类分段哈密顿向量场,其轨道是分段直线,并发展了与最佳回复动力学的联系。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 03:00:00
博弈论和物理学之间的联系有望使我们理解并可能利用非平衡博弈动力学中的隐藏结构,类似于本文中我们如何正式证明混沌动力学的时间平均值收敛于平衡值。作为动力系统的博弈动力学。最后,Papadimitriou和Piliouras【65,66】提出了一个将博弈论与动力系统拓扑联系起来的程序,特别是康利的动力系统基本定理【25】。这种方法将注意力从纳什均衡转移到更一般的递归概念,称为链递归。路由博弈23中的混沌路径概念概括了周期性和庞加莱循环,因此可以在单个框架中表达上述结果。该框架是否有用以及在多大程度上有用取决于许多因素,包括将其成功纳入计算、实验框架的可能性(当前方法见[59])。注意,我们的论文还试图与动力系统文献,特别是与发展迅速的区间映射理论以及遍历理论建立一座桥梁。8、关于固定步长与收缩步长和重设步长的讨论关于收缩步长和消失遗憾的讨论是什么?在本文中,我们用固定的步长检验EMWU 那有着不可磨灭的遗憾。如果代理利用缩小的步长(这取决于游戏历史的长度),我们的结果是否可以忽略。 = 1/√T,其结果是O(1)的消失遗憾/√T)?应用缩小步长是一种快速、无痛的方法吗?答案是否定的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 03:00:03
原因在于大O符号。O(1/√后悔:O里面是什么?当代理使用收缩步长大小实现MWU时(T)=1/√T,每个时间步的成本为cn:A→ R、 带cn(s)∈ [0,M],那么它的遗憾是xt=1Ean~xncn(an){z}MWU,带1/√T步长<mina∈ATXn=1cn(a){z}最佳固定动作+(M+1)pT log(| a |),其中| a |是代理可用的策略数量(关于为什么术语O(MpT log(| a |))在一般优化设置中无法进一步改进的讨论,另请参见[18][第2.6、2.8节,备注2.2])。因此,时间平均遗憾为(M+1)√日志(| A |)√T、 当T消失时→ ∞. 然而,对于足够大的M,后悔变得可以忽略的时间T可能是不切实际的大。在游戏的情况下,由于在线支付流的稳定性,我们可以证明更强大的遗憾边界[33,85],包括所有(连续时间)的Θ(1/T)[53],遵循正规化领导者(FTRL)动力学,其中包括MWU。然而,这些界限意味着为了达到一种小小的后悔状态, 我们仍然需要一些M为多项式的步骤/, 其中,M是我们游戏中可能的最大成本值。在我们设置的拥挤游戏中,M的价值是什么?这是最坏的可能成本M=N max{α,β}。所以,对于一个大的人口规模N,甚至对于MWU, 等到遗憾小到可以忽略不计时,等待的时间可能会很长,这是不切实际的。对于任何有意义的时间范围,代理的遗憾可能仍然很大,以至于无法应用(λ,u)-稳健性类型的结果【73】。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 03:00:06
需要一个新的理论框架来研究这些具有巨大遗憾的长过渡期。成本标准化“把戏”只掩盖了收敛速度慢的问题。在任何游戏中,包括与多个代理的拥挤游戏中,都可以将成本标准化,使其位于[0,1]而不是[0,M],事实上,这是分析无遗憾动态时Archy文献价格的标准做法。在这种情况下,后悔一词似乎更为无害:24 T.CHOTIBUT、F.FALNIOWSKI、M.MISIUREWICZ和G.PILIOURASTXt=1Ean~xncn(an){z}MWU,带1/√T步长<mina∈ATXn=1cn(a){z}最佳固定动作+2pT log(| a |){z}以最坏可能成本为单位的遗憾当然,这并不能解决问题,因为遗憾项看起来很小,但实际上是以非常大的单位表示的。这种成本标准化表明,如果在纽约,所有司机都使用同一条道路,那么他们所经历的成本等于1。当然,这种噩梦般的情景,如果能够实施的话,将转化为一场可怕的交易,需要数百或数千小时才能解决。因此,在这种情况下,真正令人遗憾的是2pT log(| A |)×(在一个有数百万人口的城市中,最严重交通堵塞的持续时间)。这是一个巨大的数字,只能通过提前运行系统来摊销。g、 纽约市的情况已经持续了数百年。使用与被测问题成比例的测量单位(就像一根卷尺,不断调整米的概念)会造成相当多的混淆,即在合理的时间范围内,状态的可及性如何。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 03:00:10
在这项工作中,我们表明,由于总需求/人口的增加,成本函数的有效放大可能会导致质量上的差异(混乱而非平衡),因此这些影响不能通过标准化成本来安全地折现,而是需要仔细研究。该领域的理论工作很好地支持了无遗憾算法对相关平衡点的缓慢收敛。无遗憾算法在大型博弈中很难找到粗糙的相关均衡,正是因为它们的遗憾以较慢的速度消失。这就是为什么已经开发了不同的集中椭球方法算法来计算游戏中的相关均衡,其中有许多代理需要紧描述[42,67]。引用【67】,“(无遗憾)学习方法需要指数级迭代才能收敛,与(1)成比例/)k对于常数k>1。另一方面,我们的椭球基算法是对数多项式().” . . . “均衡概念的难解性将使其作为行为模型变得不可信。用卡马尔·贾因的话来说:“如果你的电脑找不到它,那么市场也找不到。”我们的分析解释了这一漫长的瞬态(亚稳态)时期的算法行为,表明这种行为可能与标准的渐近平衡分析所表明的截然不同,效率更高。事实上,对现实生活中的拥塞游戏(如无线网络)进行的计算实验似乎与我们对MWU及其变体的缓慢/不稳定和性能差的理论分析一致,我们现在讨论这些理论分析。MWU及其变体在拥塞设置的实际应用中无法有效收敛。Appavoo等人[3]通过模拟研究移动网络的资源选择问题,这些问题被描述为拥塞博弈。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 03:00:13
他们研究了MWU和EXP3的性能,这是MWU的一种著名的多武装匪徒变体,并表明即使在相对较小的情况下(20个设备/代理和3个网络/资源),这些算法也无法达到平衡,事实上,它们的性能比天真贪婪的解更差。[4] 对这些故障进行更清晰的迭代,确定稳定速度慢是性能不佳的主要原因。路由游戏中的混乱之路25“…我们考虑了无线网络选择的问题。移动设备通常需要选择合适的网络来关联以获得最佳性能,这是非常重要的。领先的多臂bandit算法EXP3的优秀理论特性表明,它应该能很好地解决这类问题。然而,它在实践中表现不佳。一个主要限制是它的速度较慢。”稳定率。”步长为2-100现实作为人类行为的典范?不断缩小的学习步长是人类学习行为的一个相当艺术化的模型;一个足够小的步骤意味着学习几乎不会发生。更合理的是,排除不现实的无学习行为的情况,学习率的下限应该强制执行。我们将采用该确切参数作为MWU模型的固定学习率。事实上,我们使用固定的(但任意小)步长,而不是限制值为零的连续收缩步长,这是我们模型的一个特点,它并没有人为地限制代理的适应性,只是为了使理论结果在不合理的长时间范围后才具有约束力。缩小步长而增加总体。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 03:00:16
最后但并非最不重要的一点是,我们现在展示了如何对固定学习率进行分析 只要我们允许一个动态演化的、不断增长的种群,就可以很容易地扩展到捕捉任意步长缩小序列的非平衡现象。应该已经很清楚,步长 人口规模N(或相当于最大成本M的值)是控制系统稳定性的竞争力量。人口规模越大意味着最大成本M越大,这反过来意味着MWU的时间范围越大,通过缩小步长算法获得的时间平均遗憾越小,而对于分类平衡、无ZF状态的价格分析,则恢复其预测能力。不幸的是,如果人口以足够快的速度增长,以应对不断缩小的步长率,那么时间平均后悔永远不会消失。具体而言,从我们的分析中,我们证明了控制长期动态(如平衡、极限环、或混沌)和社会成本的相关参数是a=(α+β)N ln1.-, 见第4节。只要在每个时间步n,a(n)=(α+β)n(n)ln1.-(n)如果大于混沌阈值,则系统将始终保持在混沌状态,尽管步长变为零。例如,对于(n) =1/√n、 这表明n≥ab(α+β)ln1.-1/√n其中Abi是定理3.8中定义的混沌阈值。简单计算表明,它支持N≥ab(α+β)√n≥ab(α+β)ln1.-1/√n,也就是说,缓慢(次线性)增长的人口支持系统在其非平衡、无效、混沌的状态下永远保持不变。结论探讨了两策略非原子拥塞博弈中的乘性权值更新算法。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 03:00:19
我们发现,标准的博弈论均衡分析,如无ZF状态的代价,无法捕捉我们简单模型中极其丰富的非均衡现象。即使无ZF状态的代价等于1,当总需求N增加时,系统也会动态不稳定。每个系统都有一个承载能力,超过该承载能力,动力学将变得不平衡。事实上,如果平衡流是不对称的,当N足够大时,它们就会变得混乱。26 T.CHOTIBUT、F.FALNIOWSKI、M.MISIUREWICZ和G.Piliourast这种需求驱动的不稳定性是一种强大的现象,适用于许多不同的拥塞博弈设置(许多路径、原子/非原子拥塞博弈、不同的成本函数等)。在线性成本函数的情况下,我们在这里研究的动力学也表现出显著的时间平均特性;也就是说,在由大量总需求驱动的任何非平衡状态下,路径的时间平均流量/成本精确收敛到纳什均衡值,这一特性让人想起零和博弈中后悔最小化动态的行为。在多项式成本函数的情况下,时间平均成本表现出类似的规律性,即没有任何一条路径比平均成本便宜得多。有趣的是,当我们不断增加系统总需求时,拥塞博弈会逐渐“分解”,并将其特征变得更像零和博弈。另一方面,即使无ZF状态的价格等于1,时间平均收敛性也不能保证后悔少或社会成本低。事实上,时间平均出口和时间平均社会成本随着平衡值的波动而增加,在非平衡状态下,平衡值可能最大。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 03:00:22
在对称平衡流的情况下,波动是由极端摆动引起的;当人口规模较大时,几乎所有用户都会选择相同的路线,同时在两条路线之间切换。因此,在这种情况下,时间平均社会成本可能会尽可能高。我们的游戏学习模式看起来很好,充满了惊喜和困惑。动态系统方法提供了一个有用的框架来研究非均衡动态与经典博弈论(均衡)指标(如后悔和无政府状态价格)之间的异常联系。例如,我们在附录中表明,在某些非均衡制度中,尽管存在唯一均衡,但系统可能有多个不同的吸引子,因此时间平均后悔和社会成本严重依赖于初始条件。同样在附录中,我们还报告了其他有趣的观察结果,讨论了未来的方向,甚至包括对许多设置的扩展。还介绍了周期轨道的显著性质,如两个吸引周期轨道的共存,以及Feigenbaum\'speriod-double分岔到混沌的路径。确认Thiparat Chotibut和Georgios Piliouras确认SUTD grant SRG ESD 2015 097、MOE AcRF Tier 2 grant 2016-T2-1-170、grant PIE-SGP-AI-2018-01和NRF 2018联谊会NRF-NRFF2018-07。Fryderyk Falniowski感谢波兰国家科学中心、grant 2016/21/D/HS4/01798和COST Action CA16228“欧洲博弈论网络”的支持。西蒙斯基金会(Simons Foundation)的426602号赠款部分支持了米夏米修韦奇兹(MichaL Misiurewicz)的研究。参考文献[1]Roy L.Adler、Alan G.Konheim和M.H.McAndrew。拓扑熵。《美国数学学会学报》114(1965),309–319。[2] Llu Alsed a、Jaume Llibre和Micha l Misiurewicz。2000
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 03:00:25
一维组合动力学与熵。第5卷。世界科学出版公司。[3] Anuja Meetoo Appavoo、Seth Gilbert和Kian Lee Tan。2018年。精明的选择速度问题:使用Smart EXP3!。2018年IEEE第38届分布式计算系统(ICDC)国际会议。IEEE,188–199。路线游戏中的混乱之路27【4】Anuja Meetoo Appavoo、Seth Gilbert和Kian Lee Tan。2019年,合作速度问题:使用联合强盗!arXiv电子印刷,文章arXiv:1901.07768(2019年1月),arXiv:1901.07768页。arXiv:cs。NI/1901.07768【5】桑杰夫·阿罗拉、埃拉德·哈桑和萨蒂恩·卡勒。乘法权重更新方法:元算法和应用。《计算理论》8,1(2012),121–164。[6] 詹姆斯·贝利(JamesP.Bailey)和乔治·皮利奥乌拉斯(GeorgiosPiliouras)。2018年。零和游戏中的乘法权重更新。在ACM经济学和计算会议上。[7] 詹姆斯·贝利(JamesP.Bailey)和乔治·皮利奥乌拉斯(GeorgiosPiliouras)。2019年。零和游戏中快速而激烈的学习:用非消失步长消除遗憾。arXiv电子印刷,arXiv:1905.04532(2019年5月),arXiv:1905.04532页。arXiv:cs。GT/1905.04532[8]詹姆斯·P·贝利和乔治·皮利奥乌拉斯。网络零和博弈中的多智能体学习是一个哈密顿系统。在AAMAS。[9] P.Berenbrink、M.Hoefer和T.Sauerwald。2014年,分布式Sel fish负载平衡网络。在ACM算法事务中(TALG)。[10] 维托里奥·比洛、安吉洛·法内利和卢卡·莫斯卡德利。2017年,《关于消化游戏中的前瞻均衡》。《计算机科学中的数学结构》27,2(2017),197–214。[11] 弗朗索瓦·布兰查德。拓扑混乱:这意味着什么?《差异方程与应用杂志》15,1(2009),23–46。[12] 弗朗索瓦·布兰查德、埃利·格拉斯纳、谢尔盖·科利亚达和安东尼奥·马斯。2002年,关于LiYorke pairs。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 03:00:29
《f¨ur die reine und angewandte Mathematik杂志》547(2002),51–68。[13] 弗朗索瓦·布兰查德、文黄和卢博米尔·斯诺哈。2008。置乱集的拓扑大小。数学学术讨论会110,2(2008),293–361。[14] Avrim Blum、Eyal Even Dar和Katrina Ligett。无遗憾路由:路由博弈中遗憾最小化算法纳什均衡的收敛性。第二十届ACM分布式计算原理年度研讨会的筹备工作。ACM,45–52。[15] 鲁弗斯·鲍恩。拓扑熵与公理A.过程。Sympos。纯数学14(1970),23–41。[16] Abraham Boyarsky和Pawel Gora。2012,《混沌定律:一维不变测度和动力系统》。施普林格科学与商业媒体。[17] G.W.布朗。通过虚拟游戏的迭代解。《生产和分配的活动分析》,T.C.Koopmans(编辑),纽约:Wiley。(1951).[18] Nicol\'o Cesa Bianchi和G\'abor Lugoisi。2006.预测、学习和游戏。剑桥大学出版社。[19] Yun Kuen Cheung和Georgios Piliouras。2019年,《极小值优化中的漩涡而非平衡:零和游戏中在线学习的混沌和奶油效应》。骑着小马。[20] Thiparat Chotibut、Fryderyk Falniowski、Micha l Misiurewicz和Georgios Piliouras。2018年,博弈论中的混沌地图家族。arXiv:1807.06831[数学DS]手稿可在https://arxiv.org/abs/1807.06831.[21]G克里斯托杜鲁和E.库特索皮亚斯。有限拥挤博弈的无政府代价。STOC(2005),67–73。【22】里卡多·科里尼·巴尔德斯基、罗伯特·科米内蒂、帕纳约提斯·梅尔蒂科普洛斯和马可·斯卡西尼。2017年,无政府状态价格的渐近行为。在网络和互联网经济学国际会议上。斯普林格,133–145.28 T.CHOTIBUT、F.FALNIOWSKI、M.MISIUREWICZ和G.PILIOURAS【23】里卡多·科里尼·巴尔德斯基、罗伯特·科米内蒂和马可·斯卡西尼。2016
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 03:00:32
高度拥挤的非原子网络游戏的无政府代价。在算法博弈论国际研讨会上。斯普林格,117–128。[24]Riccardo Colini Baldeschi、Roberto Cominetti和Marco Scarsini。2018年,平行网络中高度拥挤的路由游戏的无政府代价。《计算系统理论》(2018),1-24。[25]查尔斯·康利。孤立不变集与莫尔斯指数。38号。美国数学Soc。[26]Jos\'e Correa、Jasper de Jong、Bart de Keijzer和Marc Uetz。2018年。网络路由的非效率和子博弈完美均衡。运筹学数学(2018)。【27】C.达斯·卡拉基斯(C.Daskalakis)、R.弗隆吉罗(R.Frongillo)、C.帕帕迪米特里欧(C.Papadimitriou)、G.皮耶拉科斯(G.Pierrakos)和G.Valiant。关于纳什均衡的学习算法。算法博弈论研讨会(SAGT)(2010),114–125。[28]曼弗雷德·登克、克里斯蒂安·格里伦伯格和卡尔·西格蒙德。2006,《碰撞空间的遍历理论》。第527卷。斯普林格。[29]Eyal Even Dar和Yishay Mansour。鱼类改道的快速收敛。第十六届ACM-SIAM离散算法年度研讨会(SODA’05)的筹备工作。772–781.[30]米切尔·J·费根鲍姆。非线性变换的普遍度量性质。《统计物理学杂志》第21期(1979年)。[31]Michal Feldman、Nicole Immorlica、Brendan Lucier、Tim Roughgarden和VasilisSyrgkanis。2016年,大型游戏中无政府状态的代价。第四十八届ACM计算理论年度研讨会论文集(STOC’16)。ACM,美国纽约州纽约市,963–976年。[32]Simon Fischer、Harald R¨acke和Berthold V¨ocking。通过自适应采样方法快速收敛于Wardrop平衡。《三十八年一度的ACM计算理论研讨会论文集》(STOC’06)。653–662.[33]Dylan J Foster、Thodoris Lykouris、Karthik Sridharan和Eva Tardos。2016年,《游戏中的学习:快速收敛的稳健性》。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 03:00:35
神经信息处理系统的进展。4727–4735.[34]Dimitris Fotakis、Alexis C.Kaporis和Paul G.Spirakis。原子充血游戏:快速、近视和并发。在算法博弈论中,Burkhard Monineand Ulf Peter Schroeder(编辑)。计算机科学课堂讲稿,第4997卷。海德堡斯普林格伯林,121–132。[35]Dimitris Fotakis、Spyros Kontogiannis和Paul Spirakis。2005年。Sel fish unsplitable flow。理论计算机科学348,2–3(2005),226–239。《自动机、语言和编程:算法和复杂性》(ICALP-A 2004)。[36]德鲁·福登伯格和大卫·K·莱文。1998年,《游戏学习理论》。按键。【37】Tobias Galla和J.Doyne Farmer。2013年,《学习复杂格言的复杂动力学》。110, 4 (2013), 1232–1236.[38]高兵和沈卫晓。2014年,Summability意味着Collet–Eckmann几乎可以肯定。遍历理论与动力系统34,4(2014),1184–1209。[39]Eli Glasner和Benjamin Weiss。对初始条件的敏感依赖。非线性6,6(1993),1067–1085。路线游戏中的混乱路线29[40]伊莱·格拉斯纳和叶向东。2009年,《局部熵理论》。遍历理论与动力系统29,2(2009),321–356。【41】J.Hobbauer和K.Sigmund。进化博弈与种群动力学。剑桥大学出版社,剑桥。[42]Albert Xin Jiang和Kevin Leyton Brown。紧对策中精确相关均衡的多项式时间计算。第12届ACM电子商务会议记录。ACM,119–126。【43】R.Kleinberg、K.Ligett、G.Piliouras和E.Tardos。2011年,超越纳什均衡。在计算机科学创新研讨会上。【44】罗伯特·克莱因伯格、乔治·皮利奥乌拉斯和伊娃·塔多斯。乘法更新在拥塞游戏中执行通用无悔学习。在ACM计算理论研讨会(STOC)上。【45】R。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 03:00:38
Kleinberg、G.Piliouras和E.Tardos。2011年,公告板模型中的负载平衡无悔。分布式计算24,1(2011),21–29。【46】Elias Koutsoupias和Christos H.Papadimitriou。最坏情况均衡。InSTACS。404–413.【47】米兰·库赫塔和雅罗斯拉夫·斯米塔尔。两点置乱集意味着混沌。欧洲迭代理论会议论文集ECIT 87(Caldes de Malavella(西班牙),1987)。世界Sci。出版,新加坡。[48]奥斯卡·E·兰福德。费根鲍姆不动点存在的一个简短证明。《数学物理通讯》96(1984)。【49】李健、叶向东。2016。拓扑动力学混沌理论的最新发展。数学学报,英文系列32,1(2016),83–114。[50]Tien Yien Li和James A.Yorke。第三阶段意味着混乱。《美国数学月刊》82、10(1975)、985–992。米哈伊尔·柳比奇。作为混沌定性可解模型的二次族。通知AMS 47(2000),1042–1052。【52】T.Mai、I.Panageas、W.Ratcliff、V.V.Vazirani和P.Yunker。2018年,零和差异博弈中的周期与生物多样性。在ACM EC中。【53】Panayotis Mertikopoulos、Christos Papadimitriou和Georgios Piliouras。2018年,Cyclesin对抗性正规化学习。在ACM-SIAM离散算法研讨会上。[54]Micha l Misiurewicz。1979年,用于绘制间隔的马蹄铁。公牛Acad。波隆。Sci。谢尔。Sci。27 (1979), 167–169.[55]Micha l Misiurewicz和Wies law Szlenk。分段单调映射的熵。数学研究67,1(1980),45–63。【56】Dov Monderer和Lloyd S Shapley。1996年。具有相同利益的虚拟游戏财产。《经济理论杂志》68,1(1996),258–265。【57】塞加内什·纳加拉扬(Sai Ganesh Nagarajan)、萨梅·穆罕默德(Sameh Mohamed)和乔治·皮利奥乌拉斯(Georgios Piliouras)。2018
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 03:00:42
进化博弈动力学中的三体问题:收敛性、周期性和极限环。在第17届自主智能体和多智能体系统国际会议记录中。国际自主代理和多代理系统基金会,685–693。【58】诺姆·尼桑、蒂姆·劳夫加登、伊娃·塔多斯和维杰伊·瓦齐拉尼。2007年,《算法游戏理论》。美国纽约州纽约市剑桥大学出版社【59】Shayegan Omidsha fiei、Christos Papadimitriou、Georgios Piliouras、Karl Tuyls、MarkRowland、Jean Baptiste Lespiau、Wojciech M Czarnecki、Marc Lanctot、Julien Perolat、30 T.CHOTIBUT、F.FALNIOWSKI、M.MISIUREWICZ和G.Piliourand Remi Munos。2019年{\\alpha}-排名:多智能体进化评估。arXiv预印本arXiv:1903.01373(2019)。[60]乔治·奥斯特罗夫斯基和塞巴斯蒂安·范斯特林。与零和博弈相关的分段线性哈密顿流:转移组合学和遍历性问题。规则与混沌动力学16,1-2(2011),128–153。[61]乔治·奥斯特罗夫斯基和塞巴斯蒂安·范斯特林。2014年,游戏的支付绩效。《动力学与游戏杂志》,第1篇(2014),621-638页。【62】Gerasimos Palaiopanos、Ioannis Panageas和Georgios Piliouras。2017年。拥挤游戏中乘法权重更新,步长不变:收敛、极限周期和混沌。神经信息处理系统的进展。5872–5882.【63】马可·潘加洛、托尔斯滕·海因里希和J·多因·法默。2019年。一般游戏中的最佳回复结构和均衡收敛。《科学进步》5,2(2019),eaat1328。【64】马可·潘加洛、詹姆斯·桑德斯、托拜厄斯·加拉和多恩·法默。2017年,《2 x 2游戏中学习动态的分类》。arXiv电子印刷,文章arXiv:1701.09043(2017年1月),arXiv:1701.09043页。arXiv:q-fin.EC/1701.09043【65】克里斯托斯·帕帕迪米特里欧和乔治·皮利奥乌拉斯。2018
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 03:00:46
从纳什均衡到链递归集:博弈论的算法解概念。熵20,10(2018)。【66】克里斯托斯·帕帕迪米特里奥和乔治·奥斯·皮利奥乌拉斯。2019年。游戏动力学作为游戏的意义。ACM SIGecom交易所16、2(2019)、53–63。【67】克里斯托斯·H·帕帕迪米特里奥和蒂姆·劳夫加登。计算多人博弈中的相关均衡。J、 ACM 55,3,第14条(2008年8月),29页。【68】乔治·皮利奥乌拉斯(Georgios Piliouras)、卡洛斯·尼托·格兰达(Carlos Nieto Granda)、亨里克·克里斯滕森(Henrik I.Christensen)和杰夫·沙玛(Je ffs.Shamma)。2014,《持久模式:超越均衡和效用的多智能体学习》。伊纳马斯。181–188.[69]乔治·皮利奥乌拉斯(GeorgiosPiliouras)和伦纳德·舒尔曼(LeonardJ.Schulman)。2018年。学习动力和竞争性物种的共同进化。在ITC中。【70】乔治·皮利奥乌拉斯和杰夫·沙玛。2014。混沌优化:通过庞加莱递推对复杂极限集的凸松弛。第二十届ACM-SIAM离散算法年度研讨会论文集。暹罗,861-873年。【71】J.罗宾逊。一种求解博弈的迭代方法。数学年鉴54(1951),296-301。【72】R.W.罗森塔尔。1973。一类具有纯策略纳什均衡的对策。《国际博弈论杂志》2,1(1973),65–67。蒂姆·劳夫加登。无政府状态代价的内在稳健性。过程中。STOC的。513–522.蒂姆·劳夫加登。2016年,二十场算法博弈论讲座。剑桥大学出版社。[75]蒂姆·劳夫加登和伊娃·塔多斯。sel fish路由有多糟糕?《美国医学会杂志》(JACM)49,2(2002),236–259。【76】西尔维·吕特。2017年,区间混乱。大学系列讲座,第67卷。美国数学学会。[77]詹姆斯·B·T·桑德斯、J·多恩·法默和托拜厄斯·加拉。2018年,在众多玩家参与的游戏中,混沌动力学的盛行。科学报告8(2018年)。[78]William H.Sandholm。2010年,《人口博弈与进化动力学》。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 03:00:50
MITPress公司。路线游戏中的混乱之路31【79】佐藤裕如、秋山荣三和J.Doyne Farmer。2002年。学习简单双人游戏中的混乱。《国家科学院学报》99,7(2002),4748–4751。【80】哈特·塞尔朱和马斯·科勒尔·安德烈。简单的适应性策略:从后悔匹配到解耦动态。第4卷。《世界科学》(World Scientifi fic)[81]Aleksandr N.Sharkovsky。直线到自身的连续映射的循环共存。乌克兰。数学中弘。16 (1964), 61–71.[82]雅罗斯拉夫·斯米塔尔。零熵混沌函数。美国数学学会学报297,1(1986),269–282。科林·斯派洛、塞巴斯蒂安·范斯特林和克里斯托弗·哈里斯。3x3games中的虚拟游戏:周期性行为和混沌行为之间的过渡。《游戏与经济行为》63,1(2008),259–291。史蒂文·斯特罗加茨。非线性动力学与混沌。珀尔修斯出版社。【85】瓦西里斯·塞尔卡尼斯、阿列赫·阿加瓦尔、罗海鹏和罗伯特·E·夏皮雷。2015年,游戏规则化学习快速融合。第28届神经信息处理系统国际会议记录(NIPS\'15)。麻省理工学院出版社,马萨诸塞州剑桥,美国,2989–2997。[86]迈克尔·塔博尔。非线性动力学中的混沌与可积性:导论。威利,纽约。塞巴斯蒂安·范斯特林和科林·斯派洛。2011年,3x3游戏中的虚拟游戏:混乱和抖动行为。《游戏与经济行为》73,1(2011),262–286。约翰·冯·诺依曼。1928年的今天,Zur Theorie der Gesellschaftspiele。数学安。100 (1928),295–300.【89】约翰·冯·诺依曼和奥斯卡·摩根斯坦。博弈论与经济行为。普林斯顿大学出版社。【90】本杰明·韦斯。2000年,《单轨动力学》。CBMS区域会议系列《数学》,第95卷。美国数学学会,普罗维登斯,RI。[91]熊金成。一个具有拓扑熵的混沌映射。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 03:00:53
数学学报,英语系列6,4(1986),439–443。[92]H Peyton Young。战略学习及其局限性。牛津大学出版社。32 T.CHOTIBUT、F.FALNIOWSKI、M.MISIUREWICZ和G.PILIOURASAppendicesAppendix A.吸引轨道的性质在本节中,我们研究了与区间映射fa,b相关的吸引周期轨道的性质:[0,1]→ [0,1](21)fa,b(x)=xx+(1- x) exp(a(x- b) )。我们在正文中指出,当b=0.5时,当a<8时,动力学将向固定点b=0.5收敛。对于任何a≥ 8,长时间动力学将收敛于周期2的吸引周期轨道,位于{σa,1- σa}。因此,分叉图围绕b=0.5对称,如图5的顶图所示。在这种情况下,时间平均后悔很好地接近其上限,归一化时间平均社会成本逐渐逼近最大值2。当b与0.5不同时,我们在正文中指出,如果a足够大,混沌的出现是不可避免的。到chaosis的倍周期分岔路线肯定会出现。正文的图2显示了Nb=0.7时的混沌分岔图。在这种不对称情况下,标准平衡分析仅适用于当执行点b稳定时,即当| fa,b(b)|≤ 1,或当≤ 2/b(1- b) 。Feigenbaum的混沌通用路径:图6显示了作为两个自由参数a和b函数的周期图。对于我们的双峰映射fa,b,报告费根鲍姆的混沌路径的数值观测很有趣。虽然费根鲍姆的普适性已知适用于具有二次最大值的一维单峰区间映射[30,48,86],但我们也观察到了费根鲍姆的双峰区间映射的倍周期混沌路径。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 03:00:56
具体而言,通过选择a和改变b,我们数值测量比率(22)δn≡bn+1- bnbn+2- bn+1,αn≡dndn+1,其中bn表示周期2n轨道出现的值,dn=fn-1a、b(xl)-左临界点xl=1.-第一季度-一(fa达到最大值的点)属于2n轨道。随着n变大(我们在n=12时截断观察值),我们发现(23)δn=12≈ 4.669 . . . , αn=12≈ -2.502 . . . ,这与费根鲍姆的普适常数δ=4.669201609102990一致,为4位数。和α=-2.502907875 . . . , 例如,在逻辑图中出现在通往朝圣的倍周期路线中。两个吸引周期轨道的共存以及遗憾和社会代价的非唯一性:当a>4时,映射fa,bha是一个负的Schwartzian导数,因此它有两个吸引或中性周期轨道。虽然每个周期轨道的时间平均值精确收敛到纳什均衡b,但方差极限→∞TPTn=1(xn- b) 同时存在的周期轨道可能会有所不同。因此,依赖于方差的归一化时间平均社会成本和时间平均后悔可以是多值的。获得的值取决于动力学渐近达到的吸引周期轨道的方差,其本身取决于初始条件x。通过这种方式,我们可以数值近似有符号的第二费根鲍姆常数α[84]。路线游戏33中的混乱路线图5。即使在b=0.5的对称情况下,分叉图(上图)也表明了总需求N增加所驱动的路由博弈的不稳定性, = 1.-1/e正常情况下,soa=N。在这种对称情况下,长时间动力学平衡时,网络的容量为N*b=8。在容量以上,吸引周期2的周期轨道出现。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 03:00:59
(中)紫色圆圈符号所示的时间平均后悔在分岔处突然变成了严格的正后悔。遗憾界限也非常接近实际值。(下图)在分叉处,标准化时间平均社会成本也突然变得大于1。即使在对称的情况下,无ZF计量的经典价格在N>N时失败*b=8。图7揭示了两个共存的初始条件相关吸引周期轨道是如何交织在一起的,图8报告了两个共存周期轨道的证据,它们的变量不同,导致多值时间平均后悔和社会成本。轨道的稳定性:除了周期图之外,我们还通过考虑Lyapunov指数hlog | fa,b | i来研究吸引轨道的稳定性,其中h·i表示时间平均值。图9(底部)显示了与不同牵引轨道相关的李雅普诺夫指数,揭示了延伸支腿结构产生于theorbits变为超稳定的情况,即两个临界点之一是theorbits的元素。在相同周期(相同颜色)的区域内,如果其中一个临界点是轨道的一个元素,则称轨道为超稳定,因此fa,b(xc)=0。这意味着李雅普诺夫指数原则上是-∞, 可视为白色明亮的颜色。34 T.CHOTIBUT、F.FALNIOWSKI、M.MISIUREWICZ和G.PILIOURASFigure 6。与地图(21)相关的小周期吸引周期轨道的周期图。这些颜色将吸引周期轨道的周期编码如下:周期1(固定点)=黄色,周期2=红色,周期3=蓝色,周期4=绿色,周期5=棕色,周期6=青色,周期7=暗灰色,周期8=洋红色,周期大于8=白色。只有当固定点b稳定时,即当a≤ 2/b(1- b) 。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 03:01:02
在相空间的其他区域,出现了非平衡动力学,系统通过倍周期分岔路径进入白区的混沌。图片由以下算法生成:放弃20000次初步迭代。如果| fn(x),则认为一个点是周期n的周期-x |<0.0000000001,并且它不是小于n的任何周期的周期。由于起点是左临界点xl=1/2,因此会导致轻微的不对称-p1/4- 1/a.此外,对于固定的a,当我们改变b并从外层渗透到混沌区域(白色)时,我们通过数值观察Feigenbaum的混沌普遍路径,如下所述。两条超稳定延伸支腿曲线相交。当两个临界点都是周期轨道的元素时,就会出现这种情况。此外,请注意,图6揭示了周期图中定性相似的延伸支腿结构分层出现,混沌状态夹在两层之间。请注意,连续层的周期相差1。为了理解这些周期递增的层出现的原因,我们研究了这些层中的超稳定周期轨道,发现除了左临界点xl=1/2之外,轨道的所有元素-p1/4- 1/a和它的图像fa,b(xl)约为0,与轨道周期无关。通过这一观察,我们现在利用推论3.4的纳什均衡性质的时间平均收敛性,近似每个层中的一个超稳定区域。也就是说,设xl是周期p的周期轨道的元素,只有xl和fa,b(xl)显著大于0,那么从推论3.4我们得到(24)xl+fa,b(xl)+fa,b(xl)+···+fp-1a、b(xl)| {z}≈ 0=pb。路由游戏中的混乱之路35图7。两个依赖于初始条件的吸引周期轨道的共存。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 03:01:06
这些图片的生成过程与图6中所述的过程相同,只是这里顶部和底部图片的初始条件分别位于左侧和右侧临界点。还有,b∈ [43/80、51/80]和∈ [4, 54]. 颜色方案与图6相同:周期1(固定点)=黄色,周期2=红色,周期3=蓝色,周期4=绿色,周期5=棕色,周期6=青色,周期7=暗灰色,周期8=洋红,周期大于8=白色。数值结果表明,对于周期较大的周期轨道,除xl和fa外,b(xl)的各元素均接近0的近似值变得越来越好;因此,我们对 1、至主导订单ina、xl≈aandfa,b(xl)≈1+ae1-绝对值(24)为A+1+ae(1-ab)≈ pb。定义(25)S(a,b)=ab+b+(ab)e(1-ab),我们得到了条件(26)S(a,b)≈ p、 作为一个 1,对于xl,在具有上述性质的周期p的周期轨道上。图10显示了p=2,3,…,的S(a,b)水平集,10随着周期的增加,精确跟踪延伸支腿结构,表明这些超稳定轨道是图6.36 T.CHOTIBUT、F.FALNIOWSKI、M.MISIUREWICZ和G.PILIOURASFigure 8所示延伸支腿层的骨架。在b=0.61时,两个吸引周期轨道与两个不同的变量共存,意味着时间平均后悔和归一化时间平均社会成本的非唯一性。像往常一样,我们开始 = 1.- 1/e,因此N=a.(顶部)Shaddegreen区域中的N范围显示两个吸引周期轨道共存。如果初始条件为左(右)临界点xl(xr),则选择蓝色(红色)周期轨道。正如我们的双峰映射fa,b的负Schwartzian导数所保证的那样,存在最多2个共存的吸引周期轨道。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 03:01:10
两个周期轨道的方差明显不同;因此,依赖于方差的时间平均后悔(中间)和归一化时间平均社会成本(底部)是多值的。获得哪些值取决于初始条件。此外,我们可以近似地得到临界点xl和xrbecometh都是这些超稳定周期轨道元素的条件。在这些特定的轨道排列中,我们需要xr=fa,b(xl)。从(24)中,我们得到xl+fa,b(xl)≈ pb。由于xl+xr=1,我们得出结论,当(27)b≈p、 anda[2 ln(a- 1) + 1] ≈p、 其中a上的条件遵循(26)和b≈p、 因此,如果我们绘制关系图=a[2 ln(a- 1) +1],该图将包含两个临界点都位于具有aforementoEnd特性的周期轨道上的情况。如图9所示,路径游戏37中的破折号“通往混乱的道路”。(下)Lyapunov指数hlog | fa,b | i通过tptn=1log | fa,b(xn)|数值近似,T=2000,以灰度显示,叠加在图7(上)中采用的周期图(上)上。Lyapunov指数的配色方案是hlog | fa,b | i<-1.5显示为白色(非常稳定的轨道),hlog | fa,b | i>0显示为黑色(不稳定或混乱)。我们可以清楚地看到,延伸支腿结构是由超稳定轨道作为每个吸引周期轨道的骨架而形成的。当两个临界点都是吸引轨道的元素时,两条延伸的支腿相交。正如所料,在分岔边界附近和混沌区域,轨道生态不稳定,如黑色所示。图10中的橄榄绿线穿过每个period-p区域内两条超级稳定曲线之间的交点。附录B。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 03:01:15
具有多种策略的拥塞对策的扩展在这一节中,我们将关于Li-Yorke混沌和时间平均收敛toNash均衡的结果推广到了多种策略的情况。我们将考虑一个具有连续的参与者/代理的m策略拥塞博弈,其中所有参与者/代理都使用乘法权重更新。每个参与者都控制着流量的一小部分。我们假设所有试剂的总流量等于N.38 T.CHOTIBUT、F.FALNIOWSKI、M.MISIUREWICZ和G.PILIOURASFigure 10。随着周期的增加,延伸支腿结构的层由超稳定周期轨道的特定公式产生。如轨道稳定性部分所述,S(a,b)=p定义了周期p的超稳定周期轨道,其性质是只有xl和f(xl)是周期轨道中不接近0的唯一两个元素。p=2,3,…,时S(a,b)的液位设置,10以不同颜色显示(底部),精确跟踪具有较大负Lyapunov指数的延伸腿部曲线(顶部)。theLyapunov指数的配色方案为hlog | fa,b | i<-1.5显示为白色(非常稳定的轨道),hlog | fa,b | i>0显示为黑色(不稳定或混乱)。虚线橄榄绿曲线B=a[2 ln(a- 1) 从(27)中获得的+1]包括两个临界点都是周期轨道的两个非近零元素的情况,即相同周期p的每个区域中的两条超稳定曲线相交的情况。这些结果提供了一个合理的答案,解释了为什么在图6的周期图中出现了周期增加的延伸支腿结构层。路由博弈中的混沌之路39我们将在时间n使用m策略之一i的玩家的分数表示为xi(n),其中i∈ {1,…,m}。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群