全部版块 我的主页
论坛 经济学人 二区 外文文献专区
2022-5-9 08:21:29
在此期间,玩家1的随机决策规则可以写成^χt(~ht,~oS(εst,-1) ,st1 |·),其中历史ht可表示为ht=(st′,xt′,oSX(εst′,-1xt′,-1) |t′=1,2。。。,T- 1) ,(39)~oS(εst,-1) 是他对其他玩家状态的观察,ST1代表玩家自己的状态。OSandoScan居住在一个完整的光谱中。当OS={0}和<<OS(·)=0时,玩家不知道其他人的状态;当OS=P(S)和@oSis出现在身份地图上时,每个人都完全意识到自己周围的环境。类似地,OSX、OSX和OSX也有不同的版本。然而,定理2和3消除了深入研究(OS、~OS、OSX、~OSX、~OSX、~OSX)有关有限遗传算法细节的需要。他们指出,NG对应物的平衡,必然既忽略了过去的历史,也忽略了当前的观察结果(εst,-1) ,对于有足够玩家的游戏来说是一个很好的近似均衡。~hth的缺失也有马尔科夫式的解释。另一方面,这种能力使,-1) 它的影响非常重要,因为这样可以节省玩家收集周围环境信息的时间。关于定理4,我们注意到以下几点。我们的每一个固定博弈都是随机博弈。对于后一种游戏的n人版本,玩家对其他人的状态有充分的了解,均衡很难计算,而且为了实现均衡,玩家之间需要高度的协调;见索兰[30]。这些平衡来自空间(2Rn)Sn×((Rn)Xn×Sn)Sn×Rn;然而,我们的NG均衡来自RS×X。同时,人们在现实生活中面临的贴现随机博弈通常是半匿名的;例如,参见Jovanoic和Rosenthal[16]中列出的示例。对于这样一个游戏,定理4表明,为了在一个大小的妥协下协调玩家的行为,可以采取一条更容易的路径。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 08:21:32
如果所有玩家都同意执行相应的NG平衡,典型的玩家1只需对自己的状态ST1做出反应,而不必放弃太多。9.2 NG均衡的来源为了进一步支持这样一种说法,即研究理想化的NG有助于理解和执行现实生活中面临的混乱有限的游戏,我们证明,对于瞬态情况,满足标准(23)和(24),对于静态情况,满足标准(35)和(36),可以相对容易地获得NGE均衡。首先,我们集中讨论第3至6节中研究的重大案例。从(22),vt(st,(ξt,χ[t+1,\'t]),σt,χ[t\'t])=ZXξt(dy)·vt(st,(δy,χ[t+1,\'t]),σt,χ[t\'t])。(40)因此,supξt∈K(S,X)vt(st,(ξt,χ[t+1,\'t]),σt,χ[t\'t])=supy∈Xvt(st,(δy,χ[t+1,\'t]),σt,χ[t\'t])。(41)因此,我们f在“t周期”情况下方便使用的平衡标准(23)是等价的,对于每t=1,2。。。,\'t,χt(st|Xt(st,σt,χ[t\'t]))=1,圣∈ S、 (42)式中,Xt(st,σt,χ[t\'t])={x∈ X | vt(st,(δX,χ[t+1,\'t]),σt,χ[t\'t])=supy∈Xvt(st,(δy,χ[t+1,\'t]),σt,χ[t\'t]),(43)和σ通过(24)定义。由(42)和(43)组成的形式与NG文献中使用的分配平衡概念非常接近,如Mas Colell[24]和Jovanovic and Rosenthal[16]。分布平衡是一个作用中的环境序列τ[1\'t]=(τt|t=1,2,…,t)∈(P(S×X))t每t=1,2,…,满足τt(~Ut(τ[t]t])=1。。。,在这里,Ut(τ[t\'t])={(s,x)∈S×X | v′t(S,X,τ[t′t])=supy∈Xv′t(s,y,τ[t′t])和v′t(s,y,τ[t′t])是一个玩家在开始阶段t时的状态和动作y,但所有阶段的其他玩家和他自己在以后的阶段按照τ[t′t]行事;与(24)对应,分配平衡也满足τ| S=σ和τt | S=τt-1.⊙ ~gt-1(·,·,τt)-1) 对于t=2,3。。。,“t。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 08:21:35
根据Jovanovic和Rosenthal[16](定理1),当S和X是紧的,每个payoffffti在所有参数中是有界的和连续的,并且每个transitionkernelGT在所有参数中是连续的,这样的平衡τ[1-t]就会存在。当我们条件意义上的平衡χ[1\'t]存在时,我们可以通过迭代地求助于τt=σt来构造分布平衡τ[1\'t]χtandσt+1=Tt(χt)oσt对于t=1,2。。。,反过来,当后一个分配平衡τ[1\'t]可用时,我们几乎可以得到一个条件平衡χ[1\'t]。对于每个t=1,2。。。,根据Duffee、Geanakoplos、Mas Colell和McLennan[9](第7.51页),我们可以确定一个χt∈ K(S,X),它也是从S到P(X)的可测量映射,满足τt=τt|S χt。因此,我们将能够从χ到χt连续构造χ[1\'t]。但即使如此,χ[t\'t]和σt=τt|S也只能满足(42)f或τt|S-几乎每个st,但不一定每个st∈ 例如,我们可以假设S={S,\'S,…}。在每个t处,构造的χ[1\'t]可以保证(42)对于那些(τt|s)(\'si)>0的\'si,但对于那些(τt|s)(\'si)=0的\'si。另一方面,可以直接得到条件平衡χ[1\'t];详见附录F.1。当涉及到第8节中研究的固定案例时,我们进行了平行的发展。这里对应于(36)的性质是χ(s | | X)∞(s,σ,χ))=1,s∈ S、 (44)其中X∞(s,σ,χ)={x∈ X | v∞(s,(δx,χ)∞), σ, χ∞) = supy∈十五∞(s,(δy,χ)∞), σ, χ∞)}, (45)和σ满意度(35)。同样,存在一个相关的分配平衡τ∈ P(S×X)在相当一般的条件下是已知的;例如,见约万诺维奇和罗森塔尔[16](理论2)。然而,平衡τ并不完全导致条件平衡χ。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 08:21:39
所以,一旦我们关注静止情况的直接方法;参见附录F.2.10,其中包括共同行动计划下的重要标志。我们已经证明,在多时段大型有限期游戏中,玩家所面临的环境将与其NG对手的环境保持接近。对于过渡和静止环境,我们的结果表明,在大型有限博弈中,一个不确定的均衡,必然既忽略了过去的历史,也忽视了其他参与者的当前状态,可以作为一个很好的近似均衡。我们认为,在某些情况下,对状态空间和动作空间的离散性要求可能会令人沮丧。除了放宽上述限制,未来的研究还可以研究收敛速度问题。致谢本研究部分得到了国家科学基金Gr ant CMMI0854803以及国家自然科学基金11371273和71502015的支持。附录A的概念和基本引理回顾了分布空间P(A)的Prohorov度量的ρAstands。引理1设A是可分度量空间。那么,对于任何n∈ N和a,a′∈ An,ρA(εA,εA′)≤nmaxm=1dA(am,a′m)。证明:设=maxnm=1dA(am,a′m)。对于任何一个A\'∈ B(A),关键的观察结果是δA′m((A′))≥ δam(A′)。(A.1)那么,εA′((A′))=Pnm=1δA′m((A′))n≥Pnm=1δam(A′)n=εA(A′)。(A.2)因此,ρA(εA,εA′)≤ .根据Parthasarathy[2 6](定理II.7.1),强大数定律适用于弱拓扑下的经验分布,因此也适用于Prohorov度量下的经验分布。在下文中,我们陈述了它的弱版本。引理2 Let可分度量空间A与分布p∈ P(A)可以给出。然后,对于任意>0,只要n足够大,pn({a∈ An |ρA(εA,p)<}>1- .由于Dvoretzky、Kiefer和Wolfolwitz[10]的不等式,上述收敛对于某些A是一致的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 08:21:42
不等式推断,当A是R或可数时,pn({A∈ An |ρA(εA,p)≤ }) > 1 - 2e-2n, > 0 .当n大于ln(3/)/(2)时,一个独立于p的数∈ P(A),上面将引出引理2中的不等式。因此,我们有以下几点。引理3当A是实线R或可数时,用引理2表示的收敛是一致的。也就是说,可以确定一个下界,使其上的每一个n都能实现引理中每一个p的不等式∈ P(A)。对于可分度量空间A,点A∈ A、 和(n)- 1) -点经验分布p∈ Pn-1(A),我们用(A,p)来表示Pn(A)的成员,它在点A上有额外的1/nW重量,但p中的概率质量被减少到(n)- 1) /n乘以其原始值。暂时∈ Anand m=1。。。,n、 我们有(am,εa)-m) n=εa。关于普罗霍洛夫度量,我们还有一个简单但有用的观察结果。引理4设A是一个可分的度量。那么,对于任何n∈ N\\{1},a∈ A、 安德普∈ Pn-1(A),ρA((A,p)n,p)≤n、 证据:让A\'∈ B(A)被选中。那么p(A′)=(m- 1) /(n)- 1) 对于一些m=1,2。。。,n、 Ifa/∈ A′,然后(A,p)n(A′)=(m- 1) /n因此(a,p)n(a′)≤ p(A′)≤ (a,p)n(a′)+n(a.3)如果a∈ A′,然后(A,p)n(A′)=m/n,因此(A,p)n(A′)-N≤ p(A′)≤ (a,p)n(a′)。(A.4)因此,|(A,p)n(A′)- p(A′)|≤n、 (A.5)由于Prohorov度量的性质,我们有ρA((A,p)n,p)≤n、 (A.6)我们就此完成了证明。对于定义1中引入的渐近相似性概念,我们认为它是在某些投影和展开下保留的。引理5设A是一个可分度量空间。还有,qn∈ P(An)每n∈ N和P∈ P(A)。假设序列qn与序列pn对称。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 08:21:46
然后,序列qn | An-1将渐近类似于序列pn-1.证明:对于任意>0,由于序列qn与序列pn的渐近相似性,对于足够大的n,我们得到qn(A′n)>1- ,(A.7)where\'n={A∈ An |ρA(εA,p)<}。(A.8)通过引理4,我们得到ρA(εA,εA)-1) ≤NA.∈ 一(A.9)因此,对于足够大的n,A′n A×A′n-1,(A.10)where\'n\'-1={a-1.∈ 一-1 |ρA(εA)-1,p)<2。(A.11)但在(A.7)中,这意味着(qn | An-1) (A′n-1) =qn(A×A′n-1) ≥ qn(A′n)>1- . (A.12)也就是说,qn | An-1a在交感神经上与pn相似-1.引理6设A为可分度量空间。还有,qn∈ P(An)每n∈ N和p,p′∈ P(A)。假设序列qn在符号上类似于序列pn。然后,序列p′×qn-1也将渐近类似于序列pn。证明:对于任何>0,由于序列qn与序列pn的渐近相似性,对于足够大的n,我们有qn-1(A\'n-1) > 1 - ,(A.13)在哪里-1={a∈ 一-1 |ρA(εA,p)<}。(A.14)通过引理4,我们得到ρA(ε(A,A),εA)≤NA.∈ A、 A∈ 一-1.(A.15)因此,对于足够大的n,A×A′n-1. A′n,(A.16)其中n′n={A∈ An |ρA(εA,p)<2}。(A.17)但在(A.13)中,这意味着(p′×qn-1) (A′n)≥ (p′×qn)-1) (A×A′n-1) =p′(A)×qn-1(A\'n-1) > 1 - . (A.18)即p′×qn-1与pn有交感相似。引理7设A和B是可分度量空间。还有,qn∈ 每n的P(An×Bn)∈ Nand p∈ P(A×B)。假设序列qn在符号上类似于序列pn。然后,序列qn | an将渐近地类似于序列(p | A)n。证明:对于任何>0,由于序列qn与序列pn的渐近相似性,对于足够大的n,我们有qn(C′n)>1- (A.19),其中c′n={c=(A,b)∈ An×Bn |ρA×B(εc,p)<}。(A.20)但通过杨[33]的(87),ρA(εA,p | A)=ρA(εc | A,p | A)≤ ρA×B(εc,p),c=(a,b)∈ C′n.(A.21)因此,C′n A′n×Bn,(A.22)其中n={A∈ An |ρA(εA,p | A)<。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 08:21:50
(A.23)结合(A.19)和(A.22),我们可以得到(qn | An)(A′n)=qn(A′n×Bn)≥ qn(C′n)>1- . (A.24)这表明,命题1:我们首先证明(i)第5节的qn |无符号相似(p | A)n.B证明。修好一些∈ (0, 1). 由于S的可数性,我们可以确定它的一些点。。。,所以每个σ({sI})>0和xi=1σ({sI})>1- . (B.1)为了方便起见,让\'S\'={S,\'S,…,\'sI}和\'S\'=S\\\'S\'。因为S是离散的,所以距离dS(\'S\',\'S\')=infs′∈\'S\',S\'∈\'S′\'dS(S′,S′)大于0。对于i,j=1,2。。。,一、 让我们用dijds(\'si,\'sj)和σifor({\'si})表示。现在定义δ=I∧ dS(\'S\',\'S\')∧ (mini6=jdij)∧ (miniσi),(B.2)仍然是严格正的。在本文中,我们使用∧ b代表min{a,b}和a∨ b代表max{a,b}。对任何人来说∈ N、 定义S\'N∈ 所以这是n={s∈ Sn |ρS(εS,σ)<δ}。(B.3)通过假设π在鼻症状上类似于σn,我们可以确保πn(S′n)>1-(B.4)使n足够大。考虑任何这样的n,以及任何s=(s,s,…,sn)∈ S′与i=1,2。。。,I.从δ开始≤ dS(\'S\',\'S\')∧ (mini6=jdij)即({si})δ,其含义来自(??),仍然是{si}本身。现在通过(B.3),εs({si})<σ({si})δ)+δ=σi+δ,(B.5)和εs({si})=1- εs({sj|j6=i}∪\'S′)>1- σ({sj|j6=i}∪\'S′)δ)- δ= 1 - σ({sj|j6=i}∪\'S\')- δ=σi- δ、 (B.6)仍然高于δ>0,因为δ≤ 迷你σi/2。为了方便起见,假设ni(s)=n·εs({si}),s中恰好为{si}的组分的数量。现在我们知道,对于每一个s,ni(s)都高于nδ∈ S′与i=1,2。。。,I.另一方面,通过引理2,每个I=1,2。。。,一、 所以当ni>ni时,(χ(\'si))ni(X′ini)>1-2I,(B.7)其中x′ini={x∈ Xni |ρX(εX,χ(\'si))<δ}。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 08:21:54
(B.8)由于δ>0,我们可以确保每i=1,2,…,nδ和ni(s)高于nif。。。,我希望你足够大。修正一个既有利于(B.4)又有利于(B.7)的大n。对于任何(s,x)∈ Sn×Xn,设*xi(s,x)是xm的ni(s)长向量,其对应的sm恰好是*si:*xi(s,x)=(xm | m=1,2,…,n,但有sm=*si)∈ Xni(s)。(B.9)定义联合国∈ B(Sn×Xn),所以u′n={(s,x)∈ Sn×Xn | s∈ S′nandxi(S,x)∈ 每个i=1,2,…,的X′ini。。。,一} 。(B.10)通过(16),(B.4)和(B.7),我们得到了(πn) χn(U′n)=ZS′nπn(ds)·IYi=1(χ(\'si))ni(s)(X′ini(s))>(1-) · (1 -2I)I>1- . (B.11)对于U′n中的任何(s,x),让我们检查εsx=ε((s,x),。。。,(sn,xn))等于σ χ. 重新调用S={S,\'S,\'sI}∪“S”。所以对于任何U\'∈ B(S×X),U′=(I[I=1{si}×X′I)[U′,(B.12)其中X′I∈ B(X)对于i=1,2。。。,一、 而U′是这样的∈“S”表示任何(S′,x′)∈ U′\'。再次注意δ≤ dS(\'S\',\'S\')∧ mini6=jdij。当我们取dS×Xto平均值dS×X((s′,X′,(s′,X′))=dS(s′,s′)∨ dX(x′,x′,(B.12)将导致toI[i=1{si}×(x′i)δ (U′)δ。(B.13)现在从(B.5)和(B.8)开始,εsx({si}×X′i)=εs({si})·εxi(s,X)(X′i)<(σi+δ).[χ(\'si}(X′i)δ)+δ]≤ (σ  χ) ({si}×(X′i)δ)+2δ+δ<(σ) χ) ({si}×(X′i)δ)+3δ,(B.14),其中最后一个不等式是由于我们选择δ≤ /I<1。同时,εsx(U′)≤ εsx(\'S′×X)=εS(\'S′)=1-IXi=1εs({si})<1-IXi=1σi+iδ<+iδ,(B.15),其中倒数第二个不等式由(B.6)引起,最后一个不等式由(B.1)引起。结合(B.12)到(B.15),我们可以得到εsx(U′)<(σ) χ) ((U′)δ)++4Iδ。(B.16)因此,ρS×X(εsx,σ χ) <+4Iδ≤ 5,(B.17)最后一个不平等来自我们的选择,δ≤ /I.由于(B.11)和(B.17)将发生在任何足够大的n上,我们看到(I)是真的。然后我们证明(ii)。为了方便起见,我们用U,σ来表示S×X χ乘以τ,对于eachn∈ N、 πN χnbyνn。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 08:21:58
从(i)中,我们得到了与τn序列相似的序列∈ (0, 1). 由于S和X的可数性,以及U的可数性,我们可以确定一些J点\'U,\'U。。。,uJ,使每个τ({uJ})>0和jxj=1τ({uJ})>1- . (B.18)为了方便起见,让\'U\'={U,\'U,\'uJ}和\'U\'=U\\\'U\'。因为S和X都是离散的,所以U也是离散的。因此,距离dU(\'U\',\'U\')=infu\'∈“你,你”∈\'U′\'dU(U′,U′)大于0。对于j,k=1,2。。。,J、 让我们用d′jk表示dU(\'uj,\'uk),用τjj表示τ({\'uj})。现在定义δ=J∧ dU(\'U\',\'U\')∧ (minj6=kd′jk)∧ (minjτj),(B.19)仍然是严格正的。对任何人来说∈ N、 定义∈ 所以u\'n={u∈ Un|ρU(εU,τ)U2·supu′∈Unmaxm=1ρS(g(u′,εu-m) ,g(u′,τ))]<δ}。(B.20)通过(i)νn与τn在症状上相似,假设g(u,·)以au无关速率连续,以及引理4,我们可以确保νn(u′n)>1-,(B.21)通过使n足够大,考虑任何这样的n,以及任何u=(u,u,…,un)∈ U′和j=1,2。。。,J.它从δ开始≤ dU(\'U\',\'U\')∧ ({uj})δ仍然是{uj}本身。现在通过(B.20),εu({uj})<τ(({uj})δ)+δ=τj+δ,(B.22)和εu({uj})>1- τ({uk|k6=j}∪\'U′)δ)- δ=τj- δ、 (B.23)仍然高于δ>0,因为δ≤ minjτj/2。为了方便起见,设n′j(u)=n·εu({uj})。现在我们知道n′j(u)在上面nδ 对于每j=1,2。。。,J.由于U和引理3在均匀Glivenko-Cantelli性质上的可数性,存在一些与b和U无关的n′,因此当每个n′J(U)>n′(g(\'uj,εU\\\'uj))n′J(U)(S′\'jn′J(U)(U))>1-2J,j=1,2。。。,J、 (B.24)如果每个u\\\'ujis- 1) -长向量,几乎与u相同,但仅与j(u)相同- 1等于‘uj,and′jn′(u′)=s的分量∈ Sn′|ρS(εS,g(\'uj,εu′\\\'uj))<δ}。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 08:22:03
(B.25)但根据(B.20),我们可以保证(g(\'uj,εu\\\'uj))n′j(u)(S′jn′j(u))>1-2J,j=1,2。。。,J、 (B.26)其中\'jn\'={s∈ Sn′|ρS(εS,g(\'uj,τ))<δ}。(B.27)由于δ>0,我们可以确保nδ 因此每j=1,2,…,n′j(u)在n′之上。。。,J.足够大。修正一个既有利于(B.21)又有利于(B.26)的大n。任何(美国)∈ Un×Sn,设| sj(u,s)是sm的n′j(u)长向量,其对应的um恰好是|uj:| sj(u,s)=(sm | m=1,2,…,n,但带有um=|uj)∈ Sn′j(u)。(B.28)定义V′n∈ B(Un×Sn),所以v′n={(u,s)∈ Un×Sn | u∈ U\'nandsj(U,s)∈ S′jn′j(u)对于每个j=1,2。。。,J} 。(B.29)让我们遵循从(B.11)到(B.17)在(i)证明中使用的相同逻辑,用适当的替换,例如J f或i,U代表s,s代表X,νnπn,τ代表σ,g(·,·,τ)代表χ,GN代表χn,V′n代表U′n,(B.4),和(B.26)代表(B.7)。然后我们可以导出(νn gn)(V′n)>1- ,(B.30)然而,对于V′n中的任何(u,s),ρu×s(εus,τ) g(·,·,τ))<5。(B.31)由于(B.30)和(B.31)发生在任何足够大的n上,我们看到 Gna在交感神经上类似于(τ 引理7将导致序列νn的渐近相似性⊙ gn=(νn) gn)| sn到序列(τ)⊙ g(·,·,τ))n=((τ) g(·,·,τ))|S)n.因此(ii)是真的。对于(iii),用u表示给定的(s,x)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 08:22:07
通过引理4,我们可以得到εu=(u,εu)-1) 非常接近εu-1对于任何u-1=(u,u,…,un)∈ 联合国-1让n足够大。因此,我们可以遵循(ii)几乎一字不差的证明,将其(B.20)替换为u′n-1={u-1.∈ 联合国-1 |ρU(εU,τ)U[2·supu′∈Unmaxm=1ρS(g(u′,εu-m) ,g(u′,τ)]<δ},(B.32)其(B.21)被(δu×νn)取代-1) ({u}×u′n-1) =νn-1(联合国)-1) > 1 -,(B.33)美国的任何选择∈ 未被美国取代-1.∈ 联合国-1.你有什么选择吗∈ 你被你取代了-1.∈ 联合国-1.定理1的证明:我们在t′上用归纳法证明。首先,注意T[T,T-1]o σ仅仅是σ本身。因此,对于t′=t,这个说法是正确的,因为根据这个假设,我们确实有πn对称相似(t[t,t-1]o σt)n=σnt。然后,对于一些t′=t,t+1。。。,假设这个说法是真的,那么tπnt′=πnt⊙ πt′-1t′=t(χnt′)⊙ ~gnt′)渐近类似于σnt′=(T[T,T′)-1] (χ[t,t′)-1]) o σt)n.假设1关于τ中的gt′(s,x,τ)等连续性,允许我们使用命题1的第(ii)部分。通过它,我们可以得到πnt′⊙ χnt′⊙ ~gnt′渐近相似(σt′)⊙ χt′⊙~gt(·,·,σt′) χt′)n.因为前者只是πn,t′+1=πnt⊙ πt′t′=t(χnt′)⊙ ~gnt′)和latterisσnt′+1=(T[tt′(χ[tt′))o σt)n,我们由此证明了t′+1的索赔。诱导过程现已完成。C第6节的证明命题2的证明:让我们在t上用归纳法证明。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 08:22:12
通过(21)和(25),对于t=`t+1,desiredresult为真。在某个时刻,t=\'t,\'t- 1.1,假设任意σt+1和任意序列^πn-1,t+1渐近类似于σn-1t+1,序列号-1^πn-1,t+1(dst+1,-1) ·vn,t+1(st+1,1,ξ[t+1,\'t],εst+1,-1,χ[t+1,\'t])收敛到vt+1(st+1,1,ξ[t+1,\'t],σt+1,χ[t+1,\'t]),收敛速度与st+1,1和ξ[t+1,\'t]无关。现在,给定序列^πn-1,t已知渐近类似于σn-我们要证明这一点-1^πn-1,t(dst,-1) ·vnt(st1,ξ[t\'t],εst,-1,χ[t\'t])将以与st1和ξ[t\'t]无关的速率收敛到vt(st1,ξ[t\'t],σt,χ[t\'t])。为方便起见,设σt+1=Tt(χt)o σt.注意,通过(22)和(26),supst1∈S、 ξ[t\'t]∈(K(S,X))t-t+1|vt(st1,ξ[t\'t],σt,χ[t\'t])-RSn-1^πn-1,t(dst,-1) ·vnt(st1,ξ[t\'t],εst,-1,χ[t\'-t])|≤ Mn1+Mn2+Mn3,(C.1),其中Mn1=sup(st1,xt1)∈S×XRSn-1×Xn-1(^πn)-1,t χn-1t)(dst、,-1×dxt,-1) ××|ft(st1,xt1,σt χt)-~ft(st1,xt1,εst,-1xt,-1) |,(C.2)Mn2=sup(st1,xt1)∈S×X,ξ[t+1,\'t]∈(K(S,X))t-tRS~gt(st1,xt1,σt χt|dst+1,1)××vt+1(st+1,1,ξ[t+1,\'t],σt+1,χ[t+1,\'t])-RSn-1×Xn-1(^πn)-1,t χn-1t)(dst、,-1×dxt,-1) ××∏nm=2RSgt(stm,xtm,εst,-mxt,-m | dst+1,m)·vn,t+1(st+1,1,ξ[t+1,\'t],εst+1,-1,χ[t+1,\'t])|,(C.3)和mn3=sup(st1,xt1)∈S×X,ξ[t+1,\'t]∈(K(S,X))t-tRSn-1×Xn-1(^πn)-1,t χn-1t)(dst、,-1×dxt,-1) ××|[RS)gt(st1,xt1,σt χt|dst+1,1)-rsgt(st1,xt1,εst,-1xt,-1 | dst+1,1)××∏nm=2RSgt(stm,xtm,εst,-mxt,-m | dst+1,m)·vn,t+1(st+1,1,ξ[t+1,\'t],εst+1,-1,χ[t+1,\'t])|。(C.4)我们现在证明,通过让nbe足够大,上述三项中的每一项都可以任意变小。对于Mn1,定义Un-1(δ) ∈ B(Sn-1×Xn-1) 对于每一个δ>0,所以-1(δ)={(st,-1,xt,-1) ∈ 锡-1×Xn-1 |ρS×X(εst,-1xt,-1,σt χt)<δ}。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 08:22:16
(C.5)从(C.2)中,我们知道Mn1≤ Mn11(δ)+Mn12(δ),其中Mn11(δ)=sup(st1,xt1)∈S×X(圣,-1,xt,-1)∈联合国-1(δ)|ft(st1,xt1,σt χt)-~ft(st1,xt1,εst,-1xt,-1) |,(C.6)和mn12(δ)=sup(st1,xt1)∈S×XR(Sn)-1×Xn-1) 联合国-1(δ)(^πn)-1,t χn-1t)(dst、,-1×dxt,-1) ××[| | ft(st1,xt1,σt χt)|+|ft(st1,xt1,εst,-1xt,-1) |].(C.7)因为假设2说@ft(s,x,τ)在τ中以(s,x)独立的速率连续,我们可以通过让δ足够小,使Mn11(δ)任意小。同时,通过序列^πn的交感相似性-1,t序列σn-1和命题1的(i)部分,我们知道序列^πn-1,t χn-1t渐近类似于序列(σtχt)n-1.所以度量(^πn)-1,tχn-1t)((Sn)-1×Xn-1) 联合国-1(δ))可以通过让n b e足够大,在任意δ处任意移动。由于▄ftis有界,这意味着Mn12(δ)也可以任意变小。对于Mn2,注意(C.3)中的第二个积分可以被理解为^πn-1,t+1(st1,xt1 | dst+1,-1) =RSn-1{[(δst1xt1×(σn)-1t χn-1t)⊙ ~gnt]| Sn-1} (dst+1,-1). 所以我们有≤ 辅助(st1、xt1)∈S×X,st+1,1∈S、 ξ[t+1,\'t]∈(K(S,X))t-t | vt+1(st+1,1,ξ[t+1,\'t],σt+1,χ[t+1,\'t])-RSn-1^πn-1,t+1(st1,xt1 | dst+1,-1) ·vn,t+1(st+1,1,ξ[t+1,\'t],εst+1,-1,χ[t+1,\'t])|。(C.8)同时,假设1允许我们使用命题1的第(iii)部分。通过序列^πn的渐近相似性-1,t序列σn-命题1的第(三)部分,引理5,我们知道序列^πn-1,t+1(st1,xt1)渐近地类似于序列σn-1吨+1吨(st1,xt1)-独立费率。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 08:22:19
然后,通过归纳假设,其中收敛率是一个lso(st+1,1,ξ[t+1,\'-t])-独立的,我们可以得出结论,通过让n足够大,可以使Mn2变得非常小。对于Mn3,定义Vn(st1,xt1,εst,-1xt,-所以vn(st1,xt1,εst,-1xt,-1,ξ[t+1,\'t])=|[RS)gt(st1,xt1,σt χt|dst+1,1)-rsgt(st1,xt1,εst,-1xt,-1 | dst+1,1)]·πnm=2gt(stm,xtm,εst,-mxt,-m | dst+1,m)××vn,t+1(st+1,1,ξ[t+1,\'t],εst+1,-1,χ[t+1,\'t])|。(C.9)然后,(C.4)可以写成asMn3=sup(st1,xt1)∈S×X,ξ[t+1,\'t]∈(K(S,X))t-tRSn-1×Xn-1××(^πn-1,t χn-1t)(dst、,-1×dxt,-1) ·Vn(st1,xt1,εst,-1xt,-1,ξ[t+1,\'t])。(C.10)注意到“联合国”的定义-1(δ)在(C.5)中,对于任何δ>0的情况,我们都可以看到Mn3≤ Mn31(δ)+Mn32(δ),其中Mn31(δ)=sup(st1,xt1)∈S×X(圣,-1,xt,-1)∈联合国-1(δ),ξ[t+1,\'t]∈(K(S,X))t-tVn(st1,xt1,εst,-1xt,-1,ξ[t+1,\'t]),(C.11)和mn32(δ)=sup(st1,xt1)∈S×X,ξ[t+1,\'t]∈(K(S,X))t-tR(st,-1,xt,-1)∈(序号-1×Xn-1) 联合国-1(δ)(^πn)-1,t χn-1t)(dst、,-1×dxt,-1) ·Vn(st1,xt1,εst,-1xt,-1,ξ[t+1,\'t])。(C.12)我们认为,当δ接近0+时,Mn31(δ)可以任意变小。根据假设1,以(s,x)-独立速率,gt(s,x,τ)在τ中是连续的,我们可以使gt(st1,xt1,εst,-1xt,-1) 对于任何(圣,-1,xt,-1) ∈联合国-1(δ)任意接近gt(st1,xt1,σt χt)表示δ足够小,不考虑(st1,xt1)。由于它的可数性,我们可以写出S={S,\'S,…}。在已知st1,xt1,εst的情况下,-1xt,-1和ξ[t+1,\'t],让我们使用简化符号γi=~gt(st1,xt1,σt) χt{si},(C.13)γ′i=~gt(st1,xt1,εst,-1xt,-1 |{si},(C.14)和vi=πnm=2ZS~gt(stm,xtm,εst,-mxt,-m | dst+1,m)·vn,t+1(st+1,1,ξ[t+1,\'t],εst+1,-1,χ[t+1,`t])。(C.15)那么,(C.9)可以表示为vn(st1,xt1,εst,-1xt,-1,ξ[t+1,\'t])=|Xiγi·vi-Xiγ′i·vi |。(C.16)注意| vi |是一致有界的,比如byv,这是因为|ft’的有界性和|t的完整性。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 08:22:24
让我成为我的一部分≥ γ′i.那么,从(C.16),我们有vn(st1,xt1,εst,-1xt,-1,ξ[t+1,\'t])≤ 2v·Xi∈I(γI)- γ′i)。(C.17)设δ小于infs6=s′dS(s,s′)>0。但是,-1,xt,-1) ∈联合国-1(δ)表示π∈I(γI)- γ′i)=gt(st1,xt1,σt χt |{si | i∈ 一} )- ~gt(st1,xt1,εst,-1xt,-1 |{si | i∈ 一} )=gt(st1,xt1,σt χt |{si | i∈ 一} )- ~gt(st1,xt1,εst,-1xt,-1 |{si | i∈ 一} )δ)<δ。(C.18)鉴于(C.17),Vn(st1,xt1,εst,-1xt,-1,ξ[t+1,\'t]),带(st,-1,xt,-1) ∈联合国-通过以与(st1,xt1,ξ[t+1,\'t])无关的速率降低δ,1(δ)可以变得非常小。根据(C.11),我们可以看到,通过使δ足够小,Mn31(δ)可以任意变小。如前所述,概率(^πn)-1,t χn-1t)((Sn)-1×Xn-1) 联合国-当n足够大时,1(δ)可以在任意δ处变得非常小。但是由于Vn(st1,xt1,εst,-1xt,-1,ξ[t+1,`t])是一致有界的,这意味着Mn12(δ)也可以任意小。因此,通过让n足够大,这三个项都可以任意变小。我们就这样完成了导入过程。定理2的证明:对于每t=1,2,…,给出(23)。。。,\'t和ξt∈ K(S,X),我们要验证(27)对于每t=1,2。。。,\'t,>0,足够大n,st1∈ S、 和ξ[t\'t]∈ (K(S,X))t-t+1。首先,我们证明(23)的一次性公式已经意味着任何多阶段单边偏差的无效性。另一种写条件的方法是,对于任何t=1,2。。。,\'t- t′和ξ[t,t+t′]∈ (K(S,X))t′+1,vt(st,(ξ[t,t+t′)-1] ,χ[t+t′,\'t]),σt,χ[t\'t])≥ vt(st,(ξ[t,t+t′),χ[t+t′+1,\'t]),σt,χ[t\'t])。(C.19)现在,对于一些t′=0,1,…,和。。。,\'t- 1.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 08:22:29
我们要证明它在t′+1时的有效性。但是通过(22),对于任何t=1,2。。。,\'t- t′,vt(st,(ξ[t,t+t′),χ[t+t′+1,\'t]),σt,χ[t\'t])- vt(st,(ξ[t,t+t′+1],χ[t+t′+2,\'t]),σt,χ[t\'t])=RXξt(st|dxt)·RS@gt(st,xt,σt χt|dst+1)××[vt+1(st+1,(ξ[t+1,t+t′),χ[t+t′+1,\'t]),Tt(χt)o σt,χ[t+1,`t])-vt+1(st+1,(ξ[t+1,t+t′+1],χ[t+t′+2,\'t]),Tt(χt)o σt,χ[t+1,`t]),(C.20),根据归纳假设(C.19),它是正的。因此,(C.19)是真的f或anyt=1,2。。。,\'t,t′=0,1。。。,\'t- t、 ξ[t,t+t′]∈ (K(S,X))t′+1。使用(C.19)多次,我们可以得出,对于任何t=1,2。。。,\'t和ξ[t\'t]∈ (K(S,X))t-t+1,vt(st,χ[t\'t],σt,χ[t\'t])≥ vt(st,(ξt,χ[t+1,\'t]),σt,χ[t\'t])≥ vt(st,(ξ[t,t+1],χ[t+2,\'t]),σt,χ[t\'t])≥ · · · ≥ vt(st,(ξ[t,\'t-1] σt,χ[t\'t])≥ vt(st,ξ[t\'t],σt,χ[t\'t])。(C.21)鉴于(C.21),如果有任何和足够大的n,ZSn,我们将有(27)-1^πn-1,t(dst,-1) ·vnt(st1,χ[t\'-t],εst,-1,χ[t\'t])>vt(st1,χ[t\'t],σt,χ[t\'t])-(C.22)和任何ξ[t\'t]∈ (K(S,X))t-t+1,ZSn-1^πn-1,t(dst,-1) ·vnt(st1,ξ[t\'t],εst,-1,χ[t\'t])<vt(st1,ξ[t\'t],σt,χ[t\'t])+。(C.23)(C.22)和(C.23)都是真正的ifZSn-1^πn-1,t(dst,-1) ·vnt(st1,ξ[t\'t],εst,-1,χ[t\'-t])-→N→+∞vt(st1,ξ[t\'t],σt,χ[t\'t]),(C.24)在(st1,ξ[t\'t])-独立收敛速度下。但这是提案2提供的。命题3的证明:由于A是离散的,我们可以用{A,\'A,…}来表示它或者{a,…,\'aI}用于某些特定的I。我们只使用for mer,因为后者同样可以治疗。对任何人来说∈ N、 定义={(N,N,…)|ni=0,1。。。,n对于每个i=1,2。。。,及+∞Xi=1ni=n}。(D.1)对于每个(n,n,…)∈ Nn,定义ann···············{a∈ 任何i=1,2,…}的|εa({ai})=nin。(D.2)请注意,每个Annn····都是对称的,不同的Annn·····都是不重叠的,a NDA=[(nn··)∈NnAnnn··。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 08:22:33
(D.3)由于上述分解,每个∈ ANA属于它自己的Ann·εa({a}),n·εa({a}),··。对于任何(n,n,··)∈ Nn,集合Annn··包含n/(Q)+∞i=1ni!)一个,比如一个。。。,安/(Q)+∞i=1ni!)。此外,对于某些ψ,每一个形式为ψa的aki∈ ψn.因此,由于qn的对称性,对于k=1,2。。。,n/(Q)+∞i=1ni!),qn({ak})=Q+∞i=1ni!n!·qn(Annn··)。(D.4)假设:≥ 对于某些i=1,2。。。。那么,正是(n)- 1)!/((倪)- 1)! ·Qj6=inj!)ak\'s中的ak1=\'ai。因此,对于任何这样的ak,qn({ai}×An-1) ∩ Annn··)=(ni- 1)! ·Qj6=inj!(n)- 1)!· qn({ak})=nin·qn(Annn··),(D.5),其中第二个等式源自(D.4)。当ni=0时,上述左侧和右侧当然也相等。把(D.3)和(D.5)结合起来,我们可以得到qn({ai}×An)-1) =X(n,n,…)∈Nnnin·qn(Annn··)。(D.6)另一方面,由于A的离散性,我们有mini6=jdA(\'ai,\'aj)>0。假设>0足够小,严格低于这个常数。然后根据前Horovmetric的性质∈ An满足ρA(εA,p)<当且仅当+∞Xi=1 |εa({ai})- p({ai})|<2,(D.7),因此只有当+∞maxi=1 |εa({ai})- p({ai})|<。(D.8)由于序列qn在符号上类似于p,对于任何>0且其严格小于mini6=jdA(\'ai,\'aj)>0的序列,我们可以选取足够大的n,以便在引理5的证明中(A.7)和(A.8)为真。定义 所以对于任何(n,n,…)∈ 不+∞Xi=1 | nin- p({ai})|<2,因此+∞最大值=1 |年- p({ai})|<。(D.9)由于(D.2)、(D.3)和(D.7),我们对(A.8)中定义的A’n有以下内容:A’n=[(n,n,…)∈N\'nAnnn··。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 08:22:36
(D.10)现在对于任何i=1,2。。。,我们有| qn | A({ai})- p({ai})|=|qn({ai}×An)-1) - p({ai})|=|(p(n,n,…)∈N′N+P(N,N,…)∈Nn\\N′N)ni·qn(Annn··)/N- p({ai})|≤ qn(A′n)·ni/n- p({ai})|+qn(An\\A′n)<2。(D.11)在这里,第一个等式来自边际概率的定义,第二个等式来自(D.6),第一个不等式可归因于(D.10),最后一个不等式归因于(A.7)和(D.8)。因此,对于每一个∈ A、 我们有limn→+∞qn | A({A})=p({A})。证明命题4:就目前而言,A={A,\'A,…}或者{a,…,aI}对于某些特定的I.前几个步骤与Lemma 5的证明中的步骤相同。对于任何大于0且足够大的n,我们可以用(A.7)到(A.11)作为证明。修正i=1,2。。。p({ai})>0。由于(A.10),A\'n∩ ({ai}×An-1)  (A×A′n)-1) ∩ ({ai}×An-1) ={ai}×A′n-1,(D.12)其中A′在(A.8)和A′n中定义-1定义见(A.11)。因此,qn({ai}×A′n-1) ≥ qn(A′n∩ ({ai}×An-1) )=qn({ai}×An-1) \\(安安)≥ qn({ai}×An-1) - qn(An\\A′n)>qn({ai}×An)-1) - ,(D.13)最后一个不平等是由于(A.7)。由于qnis是对称的,我们从命题3知道,当n是大的enoug h时,qn({ai}×An)-1) =qn|A({ai})>p({ai})>0。(D.14)结合(D.13)和(D.14),我们可以得到qn,A | An-1(\'ai|A′n-1) =qn({ai}×A′n-1) qn({ai}×An-1)> 1 -qn({ai}×An)-1)> 1 -2p({ai})。(D.15)带有一个\'n\'-1.在(A.11)的定义中,我们得到qn,A | An-1(‘ai |·)’与pn的渐近相似性-1.E第8节定理4的证明:设>0为固定值。假设t=1,2。。。和χ∈ K(S,X),我们用χt表示(χ,χ,…,χ)∈ (K(S,X))t.从(38)中,我们知道| v∞n(s,ξ[1]∞], εs-1, χ∞) - vtn(s,ξ[1t],εs-1,χt)|≤αt·f1- α.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 08:22:40
(E.1)因此,当t≥ ln(6’f/(1)- “\'α])/ln(1/\'α)+1,v∞n(s,χ)∞, εs-1, χ∞) > vtn(s,χt,εs)-1,χt)-,(E.2)andv∞n(s,ξ[1]∞], εs-1, χ∞) < vtn(s,ξ[1t],εs-1,χt)+,(E.3)对于每个s∈ S、 S-1.∈ 锡-1和ξ[1∞]∈ (K(S,X))∞. 因此,我们只需要选择一个如此大的t,并表明,当n足够大时,ZSn-1^πn-1(ds)-1) ·vtn(s,χt,εs)-1,χt)≥ZSn-1^πn-1(ds)-1) ·vtn(s,ξ[1t],εs-1,χt)-2(E.4)对于每个s∈ S和ξ[1t]∈ (K(S,X))t.既然(χ,σ)是Γ的平衡,我们知道(36)是真的。另一种写条件的方法是,在t′=0时,对于任何ξ[1,t′+1]∈ (K(S,X))t′+1,v∞(s,(ξ[1t′),χ∞), σ, χ∞) ≥ 五、∞(s,(ξ[1,t′+1],χ)∞), σ, χ∞). (E.5)现在假设(E.5)对某些t′=0,1。。。。我们要证明它在t′+1时的有效性。通过(33),(35),以及vt(s,ξ[1t],σ,χt)到v的一致收敛性∞(s,ξ[1]∞], σ, χ∞), 我们有∞(s,ξ[1]∞], σ, χ∞) =RXξ(s | dx)·【~f(s,x,σ) χ) +α·RS~g(s,x,σ) χ| ds′)·v∞(s′,ξ[2]∞], σ, χ∞)].(E.6)因此∞(s,(ξ[1,t′+1],χ)∞), σ, χ∞) - 五、∞(s,(ξ[1,t′+2],χ∞), σ, χ∞)=RXξ(s | dx)·RSg(s,x,σ) χ| ds′)××[v∞(s′,(ξ[2,t′+1],χ∞), σ, χ∞) - 五、∞(s′,(ξ[2,t′+2],χ)∞), σ, χ∞)],(E.7)根据归纳假设(E.5),这是正的。因此,(E.5)对于t′=0,1。。。。通过多次使用(E.5),我们可以得出,对于任何ξ[1t]∈ (K(S,X))t,v∞(s,χ)∞, σ, χ∞) ≥ 五、∞(s,(ξ,χ)∞), σ, χ∞) ≥ 五、∞(s,(ξ[12],χ)∞), σ, χ∞)≥ · · · ≥ 五、∞(s,(ξ[1,t-1], χ∞), σt,χ∞) ≥ 五、∞(s,(ξ[1t],χ)∞), σ, χ∞).(E.8)此外,我们从(34)中知道|v∞(s,ζ[1]∞], σ, χ∞) - vt(s,ζ[1t],σ,χt)|≤αt·f1- 无论ζ[1]是多少∞]∈ (K(S,X))∞被选中的。然而,(E.8)和(E.9)一起会导致VT(s,χt,σ,χt)- vt(s,ξ[1t],σ,χt)≥ -2′αt-1·\'f1- α≥ -(E.10)对于任何∈ S和ξ[1t]∈ (K(S,X))t.对于相应的t-周期对策,假设1和假设2存在时,命题2适用。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 08:22:43
另外,有人假设序列^πn-1交感神经代表序列σn-1.因此,对于足够大的n,ZSn-1^πn-1(ds)-1) ·vtn(s,χt,εs)-1,χt)>vt(s,χt,σ,χt)-(E.11)无论选择s∈ S、 安德茨-1^πn-1(ds)-1) ·vtn(s,ξ[1t],εs-1,χt)<vt(s,ξ[1t],σ,χt)+(E.12),无论s上的选择如何∈ S和ξ[1t]∈ (K(S,X))t.把(E.10)放到(E.12)去得到(E.4)。对于类似于第7节第二个例子的情况,我们需要考虑以下涉及πn的不变方程∈ P(Sn),这可以从它的fine-t版本(28)中得到启发:πn=πn⊙ χn⊙ ~gn。(E.13)假设(E.13)有一个渐近类似于σn的解,那么我们可以让^πn-1=πn | Sn-1.通过引理5,这个选择将满足定理4中的条件。它的意思也很清楚,让玩家在不使用自己的状态信息的情况下,最准确地更新对其他玩家状态的估计。当状态空间S是有限的时,我们又有了一个类似定理3的扩展版本。如果我们成功地找到了一个令人满意的πn,我们将能够做出第三个选择来设置每个πn-1(s |·)在扩展版本中是条件概率πn,s | Sn-1(s |·)。命题3和命题4将导致扩展版本中相应条件的满足。这里的第三个选择再次意味着玩家以最准确的贝叶斯方式更新其他玩家的状态。上述第二和第三种选择基于以下猜测。猜想1假设χ∈ K(S,X),~g∈ G(S,X)以与(S,X)无关的速率和σ,在τ中享有G(S,X,τ)的连续性∈ P(S)是不变方程σ=σ的解⊙χ⊙~g(·,·,σ)χ) 如(32)和(35)所定义。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 08:22:47
然后,每个n都会存在一个序列πnso∈ N、 P(Sn)中的πnas满足不变方程πN=πN⊙ χn⊙ ~gnas表示b y(E.13),但序列渐进地类似于序列ceσn。为了解决这个猜想,可以省略一个,以表明(i)迭代应用σt+1=σt⊙ χ ⊙ ~g(·,·,σt χ) 导致σt收敛为不变σ,(ii)迭代应用πn,t+1=πnt⊙ χn⊙ ~Gn导致πNt收敛到一个不变的πNt,并且(iii)这些收敛结果以及每个πNt到σNt的渐近相似性将导致πNtσn的收敛。到目前为止,(i)和(ii)仍然无法实现。另一方面,可以实现略弱于(iii)的目标。命题5:设A为可分度量空间,Pii为∈ N和p是p(A)的成员。而且,对于每个n∈ N、 让我来∈ P(An)的N和qnbe成员。假设piconve为p,qn为每个n为qn∈ N、 并对pni进行过敏性研究。然后,在(a)qnito-qnis以n-独立速率收敛的情况或(b)qnito-pnis以i-独立速率渐近相似的情况下,序列qnw将渐近相似于序列pn。命题5的证明:设>0。由于皮卡趋近于p,只要i足够大,我们就有ρA(p,pi)<(E.14)。假设情况(a)为真。通过qnito-qn的等n收敛性,我们可以选择i个较大的值,以确保(E.14)和任意n∈ N、 qn((A′N)/4)>qni(A′)-, 阿恩∈ B(安)。(E.15)在这种固定的情况下∈ N、 由于qnito-pni的渐近相似性,我们可以让N变大,这样qni({a∈ An |ρA(εA,pi)<}>1-. 假设情况(b)为真。由于qnito-pni的等i渐近相似性,我们可以选取足够大的n,以确保(E.16)适用于任何i∈ N
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 08:22:50
通过qnito qn的收敛,我们可以选择足够大的i,以确保(E.14),以及(E.15)对于当前的n∈ N.不管怎样,在不失一般性的情况下,我们可以假设dAn(a,a′)≥ maxnm=1dA(am,a′m)。然后,由于引理1,({a∈ An |ρA(εA,pi)<})/4 {a∈ An |ρA(εA,pi)<}。(E.17)现在我们可以推导出qn({a∈ An |ρA(εA,p)<}>qn({A∈ An |ρA(εA,pi)</2}>qn({A∈ An |ρA(εA,pi)</4})/4)>qni({A∈ An |ρA(εA,pi)</4})- /2 > 1 - (E.18),其中第一个不平等是由于(E.14),第二个不平等是由于(E.17),第三个不平等是由于(E.15),最后一个不平等是由于(E.16)。因此,序列qn在症状上类似于序列pn。与命题3和命题4一样,命题5也有助于支持同情相似概念的合法性。F第9F节的发展。1.根据S的离散性,每个χt(S|X′)都是自动连续的,因此在S中是可测的,因此K(S,X)不仅是(P(X))S的一个成员,而且也是后者本身。表示空间(P(S))-t-1by S和空间((P(X))S\'\'t=(K(S,X))\'tby X。设U=S×X。定义通信H:U=> U、 所以对于任何σ[2\'t]∈ S和χ[1\'t]∈ X,H(σ[2\'t],χ[1\'t])=HS(σ[2\'t],χ[1\'t])×HX(σ[2\'t],χ[1\'t]),(F.1),其中HS(σ[2\'t],χ[1\'t])={σ′[2\'t]∈ S|σ′t=Tt-1(χt-1) o σt-1.t=2,3。。。,\'t},(F.2)和hx(σ[2\'t],χ[1\'t])={χ′[1\'t]∈ X|χ′t(st|Xt(st,σt,χ[t\'t]))=1,t=1,2。。。,“t,圣∈ S} 。(F.3)H的一个固定点(σ[2\'t],χ[1\'t])将为(42)意义下的Γ(σ)提供一个马尔可夫均衡χ[1\'t],其中σ[2\'t]提供从周期2到t的确定性公共行动环境路径,该路径由所有采用政策χ[1\'t]的参与者生成。我们将使用Kakutinfan-Glicksberg不动点定理来证明H的不动点的存在性。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 08:22:53
但首先我们要得出两个有用的连续性结果。命题(i)σ χ在两个σ中都是连续的∈ P(S)和χ∈ (P(X))S.When g∈ G(S,X)满足G(S,X,τ)在τ中以(S,X)-独立速率(ii)σ连续⊙ χ ⊙ g(·,·,σ) χ) 我在两个方面都是连续的∈ P(S)和χ∈ (P(X))S.命题6的证明:我们首先证明(i)对于分别收敛于σ和χ的任意两个序列σm和χm,序列σmχm将收敛到σχ. 在下文中,我们省略了一些步骤背后的详细推理,因为它们已经出现在命题1的证明中。修好一些∈ (0, 1 ) . 我们可以确定它的一些点。。。,是的,所以(B.1)是正确的。为了方便起见,让\'S\'={S,\'S,\'sI}和\'S\'=S\\\'S\'。已知距离(\'S\',\'S\')=infs\'∈\'S\',S\'∈\'S′\'dS(S′,S′)大于0。对于i,j=1,2。。。,一、 使用dijds(\'si,\'sj)和σifor({\'si})表示。同样,定义δ至(B.2),其严格的敏感性得到保证。当σ和χm分别向σ和χ靠拢时,对于足够大的m,我们有ρS(σ,σm)<δ,(F.4)和ρX(χ(\'si),χm(\'si))<δ,i=1,2。。。,I.(F.5)以及δ≤ dS(\'S\',\'S\')∧ (mini6=jdij),(F.4)将产生σi- δ<σm({si})<σi+δ。(F.6)同时,(F.5)会导致χm(\'si|X′)<χ(\'si|(X′)δ)+δ,i=1,2。。。,I.(F.7)任何U\'∈ B(S×X)仍然享受(B.12)中提供的分解,即U′=(SIi=1{si}×X′i)SU′,其中X′i∈ B(X)对于i=1,2。。。,一、 而U′是这样的∈任何(S′,x′)的“S′”∈ U′\'。这将导致同样的结果(B.13)。另一方面,从(F.6)和(F.7)的右半部分开始,(σm) χm({si}×X′i)=σm({si})·χm(\'si|X′i)<(σi+δ).[χ(\'si |(X′i)δ)+δ]≤ (σ  χ) ({si}×(X′i)δ)+2δ+δ<(σ) χ) ({si}×(X′i)δ)+3δ,(F.8),其中最后一个不等式是由于我们选择δ≤ /I<1。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 08:22:56
同时,(σm) χm)(U′)≤ (σm) χm(\'S′×X)=σm(\'S′)=1-PIi=1σm({si})<1-PIi=1σi+iδ<+iδ,(F.9),其中倒数第二个不等式由(F.6)的左半部分引起,第一个不等式由(B.1)引起。通过组合(B.12),(B.13),(F.8)和(F.9),我们可以得到(σm) χm)(U′)<(σ χ) ((U′)δ)++4Iδ。(F.10)因此,ρS×X(σm χm,σ χ) <+4Iδ≤ 5. (F.11)由于(F.11)发生在任何足够大的m上,我们看到(i)是真的。然后我们证明(ii)。同样,假设两个序列σ和χ分别与σ和χ重合。从(i)中,我们知道σm χm趋于σ 我也是。根据杨[33]的(87),对于任何m,ρX(σm⊙ χm,σ⊙ χ) =ρX((σm) χm)|X(σ χ) |X)≤ ρS×X(σm) χm,σ χ). (F.12)因此,还有σm的收敛性⊙ χmtoσ⊙ χ.另一方面,S×X的离散性质意味着g(·,·,τ)是(P(S))S×X中任意固定τ的一员∈ P(S×X)。现在(i)和g(s,x,τ)在τ中以(s,x)独立速率连续这一事实将意味着,序列g(·,·,σm) χm)in(P(S))S×x收敛到g(·,·,σ) χ).让我们使用σm的收敛性⊙ χmtoσ⊙ χ在适当的替换下。由于S×x是离散的,我们可以在收敛结果中将其视为S。还有,让我们来看看σm χmasσm,σ χ为σ,sasx,g(·,·,σm) χm)为χm,g(·,·,σ) χ) 作为χ。从(i)论σm的收敛性 χmtoσ χ、 现在被视为σmtoσ的t,以及g(·,·,σm)的收敛性 χm)到g(·,·,σ) χ) ,现在被视为χmtoχ,我们可以得出(σm χm)⊙ σ χm)=σm⊙ χm⊙ g(·,·,σm) χm)将收敛到(σ) χ) ⊙ g(·,·,σ) χ) = σ ⊙ χ ⊙ g(·,·,σ) χ). 因此,(ii)也是正确的。命题7对于ea c h t=1,2。。。,\'t+1,在(22)中定义的值vt(st,ξ[t\'t],σt,χ[t\'t])在σt中是连续的∈ S和χ[t\'-t]∈ X在(st,ξ[t\'t])-独立速率下。命题7的证明:我们在t上使用归纳法。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 08:23:01
到了(21),我们的主张肯定是正确的,即fort=`t+1。假设对于一些t=\'t,\'t- 1.函数vt+1(st+1,ξ[t+1,\'t],σt+1,χ[t+1,\'t])在σt+1和χ[t+1,\'t]中以与st+1和ξ[t+1,\'t]无关的速率连续。现在我们证明了时间t时σ和χ[t\'t]的连续性∈S、 ξ[t\'t]∈((P(X))S)\'t-t+1|vt(st,ξ[t\'t],σt,χ[t\'t])- vt(st,ξ[t\'t],σ′t,χ′[t\'t])|≤ M+M+M,(F.13),其中M=sup(st,xt)∈S×X | ft(st,xt,σt χt)-~ft(st,xt,σ′t χ′t)|,(F.14)M=sup(st,xt)∈S×X,ξ[t+1,\'t]∈((P(X))S)\'t-t |[RSgt(st,xt,σt χt|dst+1)-RS~gt(st,xt,σ′t χ′t|dst+1)·vt+1(st+1,ξ[t+1,\'t],Tt(χt)o σt,χ[t+1,\'t])|,(F.15)和m=sup(st,xt)∈S×X,ξ[t+1,\'t]∈((P(X))S)\'t-tRS~gt(st,xt,σ′t χ′t|dst+1)××vt+1(st+1,ξ[t+1,\'t],Tt(χt)o σt,χ[t+1,`t])- vt+1(st+1,ξ[t+1,\'t],Tt(χ′t)o σ′t,χ′[t+1,\'t])|。(F.16)根据命题6第(i)部分,σ′t χ′t可以任意接近σt 让(σ′t,χ′t)与(σt,χt)足够接近。然后根据假设2,MCA可以通过同样的方式进行任意分配。再次假设S={S,\'S,…}。我们使用简化的表示法γ(′)i(st,xt)=gt(st,xt,σ(′)t χ(′)t |{si},(F.17)和vi(ξ[t+1,\'t])=vt+1(\'si,ξ[t+1,\'t],Tt(χt)o σt,χ[t+1,`t])。(F.18)那么,(F.15)可以表示为Mequalingsup(st,xt)∈S×X,ξ[t+1,\'t]∈((P(X))S)\'t-t|Xiγi(st,xt)·vi(ξ[t+1,\'t])-Xiγ′i(st,xt)·vi(ξ[t+1,\'t])|。(F.19)设I(st,xt)是诱导γI(st,xt)的I的集合≥ γ′i(st,xt)。注意| vi(ξ[t+1,\'t])|是有界的,比如byv,因为|ft\'的基础和|t的完整性。然后,(F.19)将引导toM≤ 2v·sup(圣、下)∈S×XXi∈I(st,xt)(γI(st,xt)- γ′i(st,xt))。(F.20)对于低于infs6=s′dS(s,s′)的δ,事件ρs(~gt(st,xt,σtχt),gt(st,xt,σ′tχ′t))<δ将触发∈I(st,xt)(γI(st,xt)- γ′i(st,xt))<δ(F.21)对于每个(st,xt)∈ S×X;在命题2的证明中查阅(C.18)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 08:23:04
但由于假设1,σ′t的收敛性 χ′tσt χt意味着我们可以使∧gt(st,xt,σ′t χ′t)任意接近gt(st,xt,σt)χt),在独立于(st,xt)的速率下。因此,在(F.20)中,通过让(σ′t,χ′t)足够接近(σt,χt),mca可以任意变小。从(F.16),我们可以得到≤ supst+1∈S、 ξ[t+1,\'t]∈((P(X))S)\'t-t | vt+1(st+1,ξ[t+1,\'t],Tt(χt)o σt,χ[t+1,`t])-vt+1(st+1,ξ[t+1,\'t],Tt(χ′t)o σ′t,χ′[t+1,\'t])|。(F.22)根据第6号提案第(ii)部分,Tt(χ′t)o σ′t=σ′t⊙ χ′t⊙ ~gt(·,·,σ′t χ′t)可以任意循环到Tt(χt)o σt=σt⊙ χt⊙ ~gt(·,·,σt) t′足够接近。根据归纳假设,MCA可以通过同样的操作任意变小。因此,我们完成了入职培训过程。下面是瞬态情况下的条件平衡存在性结果。定理5对应关系H允许一个固定点(σ[2\'t],χ[1\'t]),它为博弈Γ(σ)提供条件均衡χ[1\'t]。定理5的证明:由于S的离散性,P(S)是R | S |中的单纯形,无论|S |是有限的还是有限的,因此是紧的;这同样适用于P(X)。因此,U是向量空间R | S | t的紧子集-1+| X | | S |·t,理解为R∞如果S或X不确定。对于任何有限维Rk,我们都可以取范数| |·| | | | | | |=Pkl=1 | rl |/kforeach r=(rl | l=1,…,k)∈ Rk,而对于有限维R∞, 我们可以让| | r | |=P+∞l=1 | rl |/2l对于每个r=(rl | l=1,2,…)∈ R∞. 这样定义的范数将提供与Prohorov度量下的弱收敛性相同的收敛性。因为两个概率的凸组合仍然是一个概率,所以U也是凸的。对于任何(σ[2\'t],χ[1\'t])∈ U、 集合H(σ[2\'t],χ[1\'t])当然是非空的,因为我们可以构造一些属于它的(σ′[2\'t],χ′[1\'t])。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 08:23:08
首先,对于t=2,3。。。,\'t,我们简单地让σ′t=Tt-1(χt-1) o σt-1.然后,对于t=1,2。。。,“t和s∈ S、 设χ′t(S)是将其全部权重分配给达到最大值supy的x集合的任何度量∈Xvt(s,(δy,χ[t+1,\'t]),σt,χ[t\'t])。现在我们展示HS:U=> 和HX:=> X是闭值和凸值,以及上半连续的。这将导致H具有相同的性质。根据(F.2),每个H(σ[2\'t],χ[1\'t])只包含一个点,因此自动闭合和凸。对于上半连续性,我们只需要证明HS(σ[2\'t],χ[1\'t])中包含的值随σ[2\'t]和χ[1\'t]连续移动。但这一点已被提案6的第(二)部分所证实。根据(F.3),每个HX(σ[2\'t],χ[1\'t])是一组概率向量,每个分量概率将完整度量分配给一个特定的可测量集。这组概率向量肯定是凸的。为了证明它是闭合的,假设m=1,2。。。在HX(σ[2\'t],χ[1\'t])中形成一个序列,该序列收敛于给定的χ′[1\'t]。我们要证明χ′[1\'t]∈ HX(σ[2\'t],χ[1\'t])。(F.23)现在对于任何t=1,2。。。,“t,s∈ S、 >0,只要m足够大,χ′t(S|(|Xt(S,σ[2\'t],χ[1\'t]))≥ χ′mt(s|Xt(s,σ[2\'t],χ[1\'t]))-  = 1 - . (F.24)由于的任意性,这意味着χ′t(s|Xt(s,σ[2\'t],χ[1\'t])=1,因此(F.23)是真的。我们现在证明HXis上半部分是连续的。设σm,[2\'t]是S中收敛到给定σ[2\'t]的序列,χm,[1\'t]是X中收敛到给定χ[1\'t]的序列,χ′m,[1\'t]是X中收敛到给定χ′[1\'t]的另一个序列。每个m=1,2,…,的供应。。。,χ′m[1\'t]∈ HX(σm,[2\'t],χm,[1\'t]),(F.25)我们要证明χ′[1\'t]∈ HX(σ[2\'t],χ[1\'t])。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 08:23:11
(F.26)通过(F.3),我们可以看到(F.25)对于每个m表示,对于每个t=1,2。。。,“t和s∈ S、 χ′mt(S|Xt(S,σmt,χm,[t\'t]))=1;(F.27)而(F.26)归结为,对于每个t=1,2。。。,“t和s∈ S、 χ′t(S|Xt(S,σt,χ[t\'t]))=1。(F.28)我们定义了一些t和s。让>0足够小,这样就不需要对任何x′区分(x′)和x′ X.既然χ′mt收敛于χ′t,对于足够大的m,χ′t(s,σt,χ[t\'t])=χ′t(s|Xt(s,σt,χ[t\'t]))≥ χ′mt(s|Xt(s,σt,χ[t\'t]))- . (F.29)目前,假设已知Xt(s,σt,χ[t\'t])在(σt,χ[t\'t])中是上半连续的。通过注意σmttoσ和χm[t\'t]到χ[t\'t]收敛的假设,我们可以得到,对于足够大的m,~Xt(s,σmt,χm,[t\'t]) (~Xt(s,σt,χ[t\'t]))=~Xt(s,σt,χ[t\'t])。(F.30)因此,对于足够大的m,χ′t(s|Xt(s,σt,χ[t\'t]))≥ χ′mt(s|Xt(s,σt,χ[t\'t]))-  ≥ χ′mt(s|Xt(s,σmt,χm,[t\'t]))- (F.31),根据t o(F.27),它高于1- . 鉴于的任意性,我们可以实现(F.28)。现在我们回到上半连续性,作为P(s)×((P(X))s)t的对应-t+1到X。支持σmt收敛到σt,χm,[t\'t]收敛到χ[t\'t],X收敛到X。对于每m=1,2。。。,假设xm∈~Xt(s,σmt,χm,[t\'t]),由(43)表示svt(s,(δxm,χm,[t+1,\'t]),σmt,χm,[t\'t])≥ vt(s,(δy,χm,[t+1,\'t]),σmt,χm,[t\'t]),Y∈ X.(F.32)通过X的离散性,对于足够大的m,xm将是X。这与命题7和关于σmttoσ和χm的收敛性的假设相结合,[t\'t]到χ[t\'t],将得出,对于任何>0,只要m是大的enoug h,vt(s,(δX,χ[t+1,\'t]),σt,χt]≥ vt(s,(δx,χm,[t+1,\'t]),σmt,χm,[t\'t])- =vt(s,(δxm,χm,[t+1,\'t]),σmt,χm,[t\'t])- ≥ vt(s,(δy,χm,[t+1,\'t]),σmt,χm,[t\'t])-  ≥ vt(s,(δy,χ[t+1,\'t]),σt,χ[t\'t])- 2,(F.33)对于任何y∈ 十、
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 08:23:16
由于可以任意小,我们从(43)中可以看到x∈~Xt(s,σt,χ[t\'t])。因此,我们得到了上半连续的Xt(s,·)。综上所述,H是非空的、闭的和凸的值,以及嵌入在非对称线性拓扑空间中的紧致和凸子集U上的上半连续对应。因此,我们可以应用Kakutani Fan Glicksberg验证点定理来验证H有一个固定点。F.2固定格用S表示空间P(S)∞以及空间(P(X))Sby X∞. 让你∞= s∞×X∞. De Fifi通信H∞: U∞=> U∞, 因此,对于任何σ∈ s∞和χ∈ 十、∞,H∞(σ,χ)=HS∞(σ,χ)×HX∞(σ,χ),(F.34)式中∞(σ, χ) = {σ′∈ s∞|σ′=T(χ)o σ} ,(F.35)和HX∞(σ, χ) = {χ′∈ 十、∞|χ′(s|X)∞(s,σ,χ))=1,s∈ S} 。(F.36)H的固定点(σ,χ)∞将为静态非经济博弈Γ提供一个平稳的马尔可夫均衡χf∞在(44)的意义上,σ提供了由所有参与者生成的不变的确定性环境,即使用策略χ。为了证明均衡的存在,我们首先需要命题7的以下结果。命题8价值v∞(s,ξ[1]∞], σ, χ∞) (33)中的定义在σ中是连续的∈ s∞和χ∈ 十、∞在an(s,ξ[1∞])-独立利率。命题8的证明:从(34)中,我们看到| v∞(s,ξ[1]∞], σ, χ∞) - vt(s,ξ[1t],σ,χt)|≤αt·f1- α. (F.37)因此,对于任何>0的情况,通过在足够大的范围内进行筛选,我们可以确保|v∞(s,ξ[1]∞], σ′′, (χ′′)∞) - vt(s,ξ[1t],σ′,(χ′)t)|<,(F.38)对于任何s,ξ[1]∞], σ′和χ′。同时,命题7意味着,对于(σ′,χ′)足够接近任何给定(σ,χ),我们可以保证|vt(s,ξ[1t],σ,χt)- 对于任何s和ξ[1t],vt(s,ξ[1t],σ′,(χ′)t)|<,(F.39)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-9 08:23:20
然后,|v∞(s,ξ[1]∞], σ, χ∞) - 五、∞(s,ξ[1]∞], σ′, (χ′)∞) |≤| 五、∞(s,ξ[1]∞], σ, χ∞)-vt(s,ξ[1t],σ,χt)|+|vt(s,ξ[1t],σ,χt)- vt(s,ξ[1t],σ′(χ′)t)+vt(s,ξ[1t],σ′(χ′)t)- 五、∞(s,ξ[1]∞], σ′, (χ′)∞) |< .(F.40)因此,v∞(s,ξ[1]∞], σ, χ∞) 在(σ,χ)a t an(s,ξ[1]中是连续的∞])-独立利率。然后,我们可以使用Kakutifan-Glicksberg不动点定理得到所需的条件平衡存在性结果。定理6对应关系H∞允许一个固定点(σ,χ),它提供了g a meΓ∞用一个平衡χ。定理6的证明:由于S和X的离散性,U∞是向量空间R | S |+|X | S |的紧子集,理解为R∞如果S或X不确定。无论空间是有限的还是有限维的,我们都可以采用第5项证明中采用的标准。由于两个概率的凸组合仍然是一个概率∞isconvex。在定理5的证明中使用几乎相同的相应参数,我们可以证明H∞(σ,χ)在任意(σ,χ)∈ U∞是非空的、封闭的和凸的。我们分离了H的上半连续性∞到那里面去∞HX也是这样∞.HS的上半连续性∞第6项提案也是如此。此外,我们可以使用从(F.32)到(F.33)几乎相同的参数,这一次依赖于命题8,而不是命题7,来证明X∞(s,·)作为mp(s)×(P(X))的对应,StoX是上半连续的。然后,使用(F.25)到(F.31)中几乎相同的参数,我们可以验证HX∞是上半连续的。利用所有这些性质,我们可以应用Kakutani Fan-Glicksberg固定点理论来验证H∞有一个固定的点。参考文献[1]Adlakha,S.和B.Johari。2013.互补动态博弈中的平均场平衡。运筹学,61页,971-989页。[2] Al Najjar,N.I.a.和R.Smorodinsky。2001
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群