全部版块 我的主页
论坛 经济学人 二区 外文文献专区
2022-4-26 12:27:07
在C=2的情况下,至少有两个市场的两个阶层都有忠诚群体;如果一些市场失利,并且没有相关的忠诚群体,这种重叠会更大。总而言之,我们的计数论点的结论是→ 0限制最多C+M组可以共存。在有两个等级的三个市场场景中,这最多是五个忠诚群体。我们在三个公平市场中看到了一个例外,那里可以存在六个忠诚群体;这是因为市场之间的对称性,而我们的一般观点排除了这一点。值得注意的是,简单的计数论点如何为具有多个市场的系统给出各种新的猜想。它提供了最大数量的忠诚群体;它告诉我们,所有marketscan原则上是共存的,不同代理类别的忠诚群体至少在Cmarket上必须重叠。一个有趣的结果是出现了这样一种状态:一些市场持续只被交易员总人口的一小部分人访问。7总结与展望在本文中,我们研究了当具有固定买卖偏好的代理人动态调整以优化其市场选择时,在具有两个以上市场的系统中,市场共存是否可能。这一研究问题的动机是对多个市场的实证观察,这些市场既存在于电子市场,也存在于真实市场竞争中,吸引着忠诚的交易者。我们的目的不是重现市场化的事实,而是研究可能导致一种以前被忽视的现象的机制,即多重市场忠诚,以及由此产生的市场共存,可能会在没有任何潜在的代理人或市场异质性的情况下出现,并且只是作为代理人共同适应的结果。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-26 12:27:13
为此,我们研究了药物动力学的可能稳定状态,特别是关于碎片化的发生,即一类同质药物自发形成具有长期市场偏好的亚群体。该模型包含一个隐式的有限理性假设,因为代理不优化任何效用函数,也不以做出理性/最优选择为目标;相反,他们的行为是基于他们过去观察到的结果。根据学习参数,代理可以在随机交易和重复最有回报的过去选择的行为之间进行调整。这些代理人既不了解市场机制,也不了解各种差异的存在,也不了解他们的得分,他们只根据过去的观察结果做出决定。在这方面,由于缺乏信息和效用优化行为,这些假设违反了理性主体的假设。尽管如此,在两个市场的情况下[7]已经表明,当代理人的记忆非常长时(r→ 0)并且他们不更新他们在最后步骤中没有尝试的选项的偏好,然后检索理性行为(纳什均衡)下的预期结果。受人们在多智能体模拟中观察到的各种吸引分布结构的启发,我们探索了市场偏见的不同组合及其对碎片化现象的影响。首先,我们研究了三个公平市场的碎片化,即θ=θ=θ=0.5。这是我们发现这三个市场在代理商选择β的整个强度范围内共存的唯一情况。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-26 12:27:18
随着β的增加,我们仍然看到了一个变化,从优柔寡断的人群(代理商随机访问所有三个市场)到高度分散的人群,每个代理商类别分成三个大小相等的忠诚群体,并对一个市场有一定的偏好。我们继续探索不同的市场结构,以获得驱动细分的因素的直觉。这使我们能够确定导致分裂的两个主要原因:(i)市场偏见之间的相似性,(ii)市场的平均交易量和平均利润。两个市场之间的相似性将加剧分裂,因为如果贸易商无法有效区分两个市场,他们就更有可能在两个市场之间分裂。这种影响在几秒钟内就可以看到。5.3当第二市场和公平市场具有相同的偏差时,强分割阈值和弱分割阈值最高(按1/β计算)。交易者吸引力分布中峰值出现的顺序表明了这一点——正如我们所指出的。5.2–交易者最初倾向于在交易量和利润之间提供良好平衡的市场,然后随着选择强度的增加,他们将首先扩散到利润最大化的市场,然后扩散到交易量最大化的市场。在思考那些对回报不高的市场建立忠诚度的交易者时,前面[17,18]介绍的正规模效应和负规模效应的概念非常有用。在这些市场上,交易员受益于许多可用的交易选项(正规模效应),以及他们属于少数群体(负规模效应)。然而,与参考文献作者的发现相反。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-26 12:27:25
[17,18]我们注意到,当市场相似时,市场共存更为普遍——随着市场差异的增加,分散区域缩小。除了三个相同市场的情况外,我们发现,一旦β足够大,代理可以随机选择市场,这三个市场就永远不会在大内存限制下完全共存,即至少其中一个市场的市场份额会随着r的消失而消失→ 0.我们最多只能观察到两个市场的人口严重分化(见图4)。然后,这些市场在r的交易量中各占一定份额→ 0,但其中一个处于次主导地位,因为它仅由单个类的(部分)代理访问。从一般的计算论证中,我们进一步发现,完全市场共存,即所有代理阶层发展(联合)最大数量的忠诚群体,导致明显的专业化市场:一些代理阶层只发展对所有市场子集的忠诚(如图4所示),相反,一些市场并非所有类别的代理都访问。这并不是因为amarket明确针对代理群体的某些子集,而是因为不同代理类别能够支持的市场忠诚度有限。我们主要考虑β的中等值,这是因为我们对发现不同稳定状态的域感兴趣,因此我们直接实现了动作最小化算法。然而,对于较大的β值,它有时无法找到最小的动作路径,因此,如果人们对该机制特别感兴趣,则需要提高鲁棒性和准确性。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-26 12:27:31
一种可能是使用几何最小作用法[26]。尽管我们提出的研究在多个市场中进行选择的代理人的分析和数值方法对任意数量的市场M都是有效的,但它具有挑战性,原因有两个:(i)参数空间维度随着M的增长而增长,因此难以对所有可能的行为进行数值探索,(ii)分析方法也变得更难实施,因为分析是在维度M的吸引差异空间中进行的- 1.关于市场竞争的影响,我们的结果表明,在大记忆极限(r→ 0). 然而,对于有限记忆(r>0),人们应该认为小峰值会持续存在。在两个市场体系中,在r的特定值以上(有效地表示短记忆),只存在一个强碎片化的稳态[6],而不是两个弱碎片化和亚稳态的强碎片化状态;调查类似的结果是否也适用于多个市场将是一件有趣的事情。在这项和之前的研究中,我们调查了代理人如何根据他们对市场的探索进行适应;适应机制隐含着市场不变的假设。现实地说,一旦使用它的交易者数量减少,市场也会试图适应。如果市场只是试图最大化这一数量的交易者,人们可以推测,通过调整他们的θ偏差,他们将收敛到所有公平市场(类似于霍特林悖论[27])。另一方面,如果市场要调整以优化成功交易的数量,例如:。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-26 12:27:37
收取固定的或与利润相关的费用,那么了解在整个代理和市场体系中会实现何种类型的稳定状态将是一件有趣的事情。最后,我们研究的一个广泛含义是,在一类同质交易者中,分割(弱或强)可能会突然出现,这与其他地方[1]的说法相反,这些说法认为交易者之间的异质性是市场分割的原因。我们认为这是一个非常有趣的结果,因为它表明,经济主体的偏好结构可能是适应产生的,而不是从一开始就存在的。为此,我们对智能体在学习参数方面的同质性进行了分析,这简化了数学描述,但可以放松并进一步研究。[28]研究了代理人记忆参数r的异质性,结果表明,包含快速(r=1)和慢速(r<1)代理人的群体仍然在两个市场上分裂,临界β取决于快速交易者的比例。β的异质性在数学上可能更具挑战性,但原则上可以按照[8]中概述的程序解决。人口可分为具有相同β的交易者的子群体,其稳态市场偏好分布应在假设需求与供给市场参数固定的情况下找到。最后,应检查这些市场聚集参数是否可以从获得的贸易参考中复制,即整体解决方案是否自洽。这将是一个有趣的下一步调查,以及在交易策略和预算约束方面的异质性。感谢作者感谢彼得·麦克伯尼的有益讨论。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-26 12:27:43
PS承认EPSRC非平衡系统跨学科方法博士培训中心(CANES,EP/L015854/1)提供的激励研究环境。AA感谢贝尔格莱德物理研究所通过塞尔维亚共和国教育、科学和技术发展部提供的资助。作者的贡献。N、A.A.和P.S.将模型概念化,并将数学框架形式化。R.N.实施了数值模拟并准备了图表。R.N、A.A.和P.S.分析了结果并讨论了它们的含义。所有作者都撰写了手稿,并最终批准出版。参考文献[1]Peter Gomber、Satchit Sagade、Erik Theissen、Moritz Christian Weber和Christian Westheide。股票市场之间的竞争:合并与分裂之争述评。《经济调查杂志》,31(3):792-8142017。统一资源定位地址https://doi.org/10.1111/joes.12176.[2] 莫琳·奥哈拉和毛叶。市场分割是否会损害市场质量?《金融经济学杂志》,100(3):459-4742011。统一资源定位地址https://doi.org/10.1016/j.jfineco.2011.02.006.[3] 乔尔·哈斯布鲁克。一种证券,多个市场:确定对价格发现的贡献。《金融杂志》,50(4):1175-11991995。统一资源定位地址https://doi.org/10.1111/j.1540-6261.1995.tb04054.x.[4] 加里·肖特和蕾娜·米勒。股票交易中的暗池:政策担忧和近期发展。技术报告,2014年。统一资源定位地址https://digital.library.unt.edu/ark:/67531/metadc461960/.[5] Aleksandra Alori\'c、Peter Sollich和Peter McBurney。代理人在双重拍卖市场上的自发分离。《艺术经济学进展》编辑,埃里克·安布拉德、弗朗西斯科·J·米格尔、阿德里安·布兰切特和贝诺特·高杜,《经济学与数学系统的课堂讲稿》第676卷,第79-90页。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-26 12:27:49
斯普林格国际出版社,2015年。ISBN 978-3-319-09577-6。统一资源定位地址https://doi.org/10.1007/978-3-319-09578-3_7.[6] Aleksandra Alori\'c、Peter Sollich、Peter McBurney和Tobias Galla。在双重拍卖市场中出现合作的长期市场忠诚度。《公共科学图书馆一号》,第11(4):2016年4月1日至26日。doi:10.1371/期刊。波内。0154606.网址https://doi.org/10.1371/journal.pone.0154606.[7] 罗宾·妮可和彼得·索利奇。使用强化学习动态选择纳什均衡:异质混合均衡的出现。PloS one,13(7):e0196577,2018年。统一资源定位地址https://doi.org/10.1371/journal.pone.0196577.[8] Aleksandra Alori\'c和Peter Sollich。市场分割和市场整合:适应性交易者选择交易地点系统中的多重状态。体检E,99(6):06230922019。统一资源定位地址https://doi.org/10.1103/PhysRevE.99.062309.[9] 蔡凯、恩里科·格丁、彼得·麦克伯尼、牛晋中、西蒙·帕森斯和史蒂夫·菲尔普斯。CAT概述:市场设计竞赛。技术报告,利物浦大学计算机科学系,2009年。统一资源定位地址http://www.csc.liv.ac.uk/research/techreports/tr2009/ulcs-09-005.pdf.[10] 牛晋中、蔡凯、西蒙·帕森斯、恩里科·格丁、彼得·麦克伯尼、蒂埃里·莫约、史蒂夫·菲尔普斯和大卫·希尔德。JCAT:TAC市场设计竞赛的平台。《第七届自治代理和多代理系统国际联合会议记录》,第1649-1650页,2008年。ISSN 15582914。统一资源定位地址http://portal.acm.org/citation.cfm?id=1402747.[11] 蔡凯、牛晋中和西蒙·帕森斯。基于代理的双拍卖市场之间竞争的影响。《电子商务研究与应用》,13(4):229–242,2014年7月。ISSN 15674223。统一资源定位地址https://doi.org/10.1016/j.elerap.2014.04.002.[12] 牛晋中、蔡凯、西蒙·帕森斯和伊丽莎白·斯卡拉。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-26 12:27:56
关于自动交易市场之间竞争的一些初步结果。AAAI-07交易代理研讨会,第19-26页,2007年7月。统一资源定位地址http://www.aaai.org/Papers/Workshops/2007/WS-07-13/WS07-13-003.pdf.[13] 蒂姆·米勒和牛晋中。对在竞争市场中选择策略的评估。《电子商务研究与应用》,2012年11月14日至23日。统一资源定位地址https://doi.org/10.1016/j.elerap.2011.07.009.[14] Dhananjay K.Gode和Shyam Sunder。零智能领导者市场的配置效率:市场作为个人理性的部分替代品。政治经济学杂志,101(1):119-137,1993年。统一资源定位地址https://doi.org/10.1086/261868.[15] 戴夫·克利夫和珍妮特·布鲁顿。零还不够:关于连续双重拍卖市场的代理智能下限。惠普实验室技术报告HPL,28(3):6331997。ISSN 1523-1739。统一资源定位地址https://doi.org/10.1111/cobi.12328.[16] Bence T\'oth、Enrico Scalas、J¨urgen Huber和Michael Kirchler。多代理市场模型中信息的价值——无知者的运气。欧洲物理杂志B,55(1):115-1202007。统一资源定位地址https://doi.org/10.1140/epjb/e2007-00046-2.[17] 格伦·埃里森、德鲁·福登伯格和马库斯·莫比乌斯。竞拍。《欧洲经济协会杂志》,2(1):30-662004。统一资源定位地址https://doi.org/10.1162/154247604323015472.[18] 施冰、恩里科·H·格丁、佩鲁克瑞什宁·维特林根和尼古拉斯·R·詹宁斯。竞争性双重拍卖市场中市场选择策略和费用策略的均衡分析。自治代理和多代理系统,26(2):245–2872013。统一资源定位地址https://doi.org/10.1007/s10458-011-9190-5.[19] 伯纳德·凯劳德和布鲁诺·朱利安。鸡和蛋:中介服务提供商之间的竞争。兰德经济杂志,第309-328页,2003年。统一资源定位地址https://doi.org/10.2307/1593720.[20] 约翰·杜菲。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-26 12:28:02
基于Agent的模型和人体实验。计算经济学手册,2:949–10112006。统一资源定位地址https://doi.org/10.1016/S1574-0021(05)02019-8.[21]丹·拉德利。经济和金融领域的零智力。《知识工程评论》,27(02):273-2862012。统一资源定位地址https://doi.org/10.1017/S0269888912000173.[22]米哈伊尔·阿努弗里夫、贾斯米娜·阿里福维奇、约翰·莱迪亚德和瓦伦廷·潘琴科。在信息完全或有限的情况下,个体进化学习下连续双重拍卖的效率。进化经济学杂志,23(3):539-573,2013年。ISSN 1432-1386。统一资源定位地址http://dx.doi.org/10.1007/s00191-011-0230-8.[23]克里斯托弗·JCH·沃特金斯和彼得·达扬。Q-学习。机器学习,8(3-4):279-2921992。统一资源定位地址https://doi.org/10.1023/A:1022676722315.[24]科林·卡梅勒和特克·华浩。在正常形式的游戏中体验加权吸引学习。《计量经济学》,67(4):827-874,1999年。统一资源定位地址https://doi.org/10.1111/1468-0262.00054.[25]德华浩、科林·卡梅勒和尹宽冲。在游戏中,自我调整体验加权吸引力学习。《经济理论杂志》,133:177–198,2007年。统一资源定位地址https://doi.org/10.1016/j.jet.2005.12.008.[26]马蒂亚斯·海曼和埃里克·范登·艾因登。非平衡体系中罕见事件的最大可能性途径:应用于剪切成核。物理评论,100:1406012008。统一资源定位地址https://doi.org/10.1103/PhysRevLett.100.140601.[27]哈罗德·霍特林。在竞争中保持稳定。《经济日报》,39(153):41-571929。统一资源定位地址https://doi.org/10.2307/2224214.[28]罗宾·尼科尔。博弈论模型中的波动和大偏差。2017年,英国伦敦国王学院博士论文。统一资源定位地址https://kclpure.kcl.ac.uk/portal/files/94142430/2017_Nicole_Robin_1345260_ethesis.pdf.[29]Aleksandra Alori\'c.拍卖中自适应代理的自发分离。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-26 12:28:09
2017年,英国伦敦国王学院博士论文。[30]汉内斯·里森。福克-普朗克方程。柏林斯普林格,1984年。[31]马克·弗莱德林和亚历山大·温策尔。动力系统的随机扰动。柏林斯普林格,1998年。ISBN 0387983627。[32]弗雷迪·布切特和朱利安·雷格纳。将Eyring–Kramers转化率公式推广到不可逆扩散过程。亨利·彭加勒学院年鉴,17(12):3499–35322016。统一资源定位地址http://dx.doi.org/10.1007/s00023-016-0507-4.[33]塞琳娜·布拉德和朱利奥·比罗利。非平衡系统中的广义阿累尼乌斯定律。arXiv预印本arXiv:1204.60272012。统一资源定位地址https://arxiv.org/abs/1204.6027.[34]亨德里克·安东尼·克拉默斯。力场中的布朗运动和化学反应的扩散模型。Physica,7(4):284-304,1940年。统一资源定位地址http://dx.doi.org/10.1016/S0031-8914(40)90098-2.[35]盖伊·布宁、亚里夫·卡弗里和丹尼尔·波多尔斯基。边界驱动系统中的大偏差:数值评估和有效的大规模行为。《欧洲物理学快报》,99(2):200022012。统一资源定位地址http://dx.doi.org/10.1209/0295-5075/99/20002.AKramers-Moyal展开式在本附录中,我们给出了方程(4)中Kramers-Moyal展开式中出现的漂移和协方差矩阵的表达式。我们只给出结果;推导的步骤可以在Alori\'c[29]的论文中找到。首先,吸引力差异的漂移为:u(c)(A(c),f,f,f)=P(c)(f)P(M=1)- P(c)(f)P(M=2)- A(c)(7)u(c)(A(c),f,f,f)=P(c)(f)P(M=1)- P(c)(f)P(M=3)- A(c)(8)这里P(c)m(fm)是c类交易者在m市场的平均报酬,P(m=m)是在m市场交易的可能性,这取决于向量A(c)吸引力差异。我们没有明确地写这种依赖性来减轻符号的负担。FMS是三个市场的市场总量,即买方与卖方的比率。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-26 12:28:15
为了检查我们计算的有效性,我们将多智能体模拟过程中的聚集物F的动力学与[7]中详述的同质种群动力学下聚集物的演化进行了比较,得出了良好的一致性,如图7所示。接下来我们来看看作用于引力差的有效噪声的协方差矩阵,∑(c)∑(c)∑(c)∑(c)∑(c)∑(c)∑(c)!(9) 0 50 100 150 200t0。981.001.021.041.061.081.10φ1多智能体模拟确定性动力学图7:多智能体模拟(r=0.01,每类10个智能体)期间第一个市场的总体时间序列(买家与卖家的比率)及其在同质种群动力学下的演化之间的比较。图中曲线图的参数(θ,θ,θ)=(0.2,0.5,0.8),β=1/0.3,p(1)B=1- p(2)B=0.8。由∑(c)给出(A(c),f,f,f)=Q(c)(f)- 2.A(c)P(c)(f)P(M=1)+Q(c)(f)- 2.A(c)P(c)(f)P(M=2)+A(c)(10)∑(c)(A(c),f,f,f)=Q(c)(f)- 2.A(c)P(c)(f)P(M=1)+Q(c)(f)- 2.A(c)P(c)(f)P(M=3)+A(c)(11)∑(c)(A(c),f,f,f)=A(c)P(M=3)P(c)(f)- P(M=1)P(c)(f)+ A(c)P(M=2)P(c)(f)- P(M=1)P(c)(f)+ P(M=1)Q(c)(f)+A(c)A(c)(12),其中Q(c)m(fm)是平均平方支付,见[7]。B Freidlin-Wentzell理论在本节中描述了我们用来研究代理人学习动态稳态下多模态吸引分布的大偏差方法。如[7]中更详细的解释,小r的稳态吸引分布将在单体动力学的稳定定点附近达到峰值。对于r,这些峰的形状变成高斯分布→ 0,其协方差矩阵与r成正比,很容易确定。更难找到的是峰的权重,因为它们涉及从一个峰过渡到另一个峰的试剂的罕见波动。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-26 12:28:21
在一维中,这个问题是可处理的,因为可以给出吸引物稳态分布的显式公式[6]。在更高的维度中,详细平衡[30]会有类似的简化效果,但我们在二维吸引空间中的单代理动力学(针对每类代理)不具有这种性质。因此,在我们的方法中,我们将吸引力分布中的峰值权重视为各种峰值之间过渡的平衡结果。因此,我们需要找到这些转变的比率。为此,请注意Kramers-Moyal展开式中的单个agentlearning由噪声方差为O(r)的朗之万方程描述。对于r→ 因此,我们在低噪声限制下寻找过渡速率。这使得我们可以使用弗雷德林-温策尔理论,该理论处理的是朗之万动力学在这个极限下的大偏差[31]。Freidlin-Wentzell理论我们使用[32,33]中发展的Freidlin-Wentzell理论,该理论将EyringKramers[34]公式推广到非保守动力学的噪声激活转换速率。我们简要总结了我们在数值应用中使用的弗雷德林-温策尔理论的各个方面,并参考[31]以获得严格的数学描述,参考[32]以获得更面向统计物理学的总结。Freidlin-Wentzell理论关注两个稳定态(hereA?和A?)之间的跃迁速率;下面我们将 根据低噪声极限下非保守随机动力学的吸引差(简而言之)表示法。一般的朗之万方程可以写成˙A(t)=u(A(t))的形式+√r[∑(A(t))]1/2ξ(t)(13),其中ξ(t)是具有单位协方差矩阵的白噪声。Langevin方程中噪声的漂移μ和协方差矩阵∑在[7]中给出,用于我们的学习动力学。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-26 12:28:27
在上述通用版本中,我们省略了上标(c),表示我们正在考虑的代理类别,以及漂移和噪声协方差对市场总量的依赖性。与Langevin dynamics关联的是任何路径A(t)的Onsager Machlup动作S[A]:S[A]=Ztt˙A(t)- u(A(t))T∑-1(A(t))˙A(t)- u(A(t))dt(14)该动作根据Γ1确定观察任何路径[A(t)]的概率→2.~ 经验(-S[A]/r)(15)其中~ 这意味着等式在一个前置因子(取决于所用的时间离散化)上是真的。我们需要的主要Freidlin-Wentzell结果是速率Γ1→2.从一家公司过渡到另一家公司?托亚?(前进路径)是[31,35]Γ1→2.~ 经验(-s1.→2/r)(16)S在哪里?1.→2.任何途径都能从一个目标中实现的最小行动是什么?去一家?在有限的时间间隔内(t,t)=(-∞, ∞). 比率为2→1从A到A的反向过渡?去一家?同样是Γ2→1.~ 经验(-s2.→1/r)。我们所追求的吸引力分布将由A?安达?。这两个峰的权重ω和ω,代表了一个试剂稀释每个峰的概率,必须使前向和后向转换平衡:ωΓ1→2= ωΓ2→1(17)ωω∝ 经验s1.→2.- s2.→1r(18) 这个表达式表明,当向前和向后的最小作用不相等时,两个峰值中的一个将具有指数级的小权重r→ 0.在实践中,当(17)中的指数内的作用差与r相比较大时,这是正确的。如果它的阶数ror较小,那么我们就不能说任何关于权重的事情,因为我们不确定(17)中的前置因子,尽管我们认为它们是阶数统一的。按照Bunin等人的方法,数值求解最小作用路径。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-26 12:28:34
[35]我们通过对路径[A(t)]进行离散化,将动作作为该离散化路径的函数进行评估,然后对(离散化)路径进行最小化,从而找到最小动作。将路径离散为t=0和t=10之间的10个等距时间步;我们发现,在结果的精确性和最小化离散化操作的复杂性之间,这种参数选择是一种合理的权衡。还有其他方法可用于确定公式(14)中定义的作用的最小值,例如求解汉密尔顿-雅可比方程[32],但我们选择使用路径离散化方法,因为我们发现这对于模型参数的变化更为稳健。离散方法也可以进一步改进,例如使用几何最小作用法[26],但我们发现这不是达到所需精度的必要条件。我们对此进行了测试,例如,通过对M=2[6]的封闭式结果进行基准测试。通过将注意力限制在路径的激活部分,可以简化数值路径优化。一般来说,对于具有两个稳定固定点的系统a?还有一个?它们之间有一个鞍点A,从A开始的最佳路径?将通过鞍点A,然后放松到A?根据弛豫动力学˙A(t)=uu(A(t)),等式(14)表明,当被积函数(拉格朗日函数)沿路径的这一部分完全消失时,弛豫动力学对总作用没有贡献。因此,在一个?还有一个?可以简化为在两个?和A,即从初始固定点到鞍座。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-26 12:28:40
这一限制显著提高了数值路径优化的精度。通过上述方法,我们可以计算出单代理动态的任意两个固定点之间的行为差异,作为市场总量的函数。当两个单一代理固定点之间的行为差异消失时,这些聚集值确定了我们学习的稳态吸引分布可能有多个峰值的点。在这些值的任何一侧,吸引力分布中都有一个单峰占主导地位;在市场总量的零行动差异值下,这是一个不连续变化的峰值。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群