全部版块 我的主页
论坛 经济学人 二区 外文文献专区
2022-5-7 03:00:36
扰动博弈的Berk-Nash均衡的定义与定义1相似,唯一的区别是扰动博弈必须要求最优性。4.2学习基础我们假设一个受干扰的游戏,并假设玩家在每个t=0,1,2。。。,其中,时间-t状态和信号(ωt,st)以及扰动ξt分别从相同分布P和Pξ的每个周期中独立绘制。此外,每个玩家i都有一个先前的ui,完全支持她的(有限维)参数集Θi。在每个时段t结束时,每个玩家都使用贝叶斯规则和在过去所有时段获得的信息(她自己的信号、行动和后果)来更新信念。玩家认为他们面临着一个稳定的环境,目光短浅地最大化了当前时期的预期收益。允许(Θi)表示Θi上完全支持的概率分布集。莱比:(Θi)×Si×Xi×Yi→ (Θi)表示参与者i的贝叶斯算子:总之,我们将注意力限制在参数模型(即有限维参数空间)上,因为,否则,在正确指定的统计设置中,对于大多数先验和参数值7,贝叶斯更新不必收敛到真理(Freedman(1963)、Diaconis和Freedman(1986))。A. ΘBorel可测量和全部(ui、si、xi、yi)∈ (Θi)×Si×Xi×Yi,Bi(ui,Si,Xi,Yi)(A)='AQiθi(Yi | Si,Xi)ui(dθ)'Qiθi(Yi | Si,Xi)ui(dθ)。假设1很好地定义了贝叶斯更新。因为玩家相信他们面对的是一个带有i.i.d.扰动的静止环境,所以限制玩家i在时间t的行为(uit,sit,ξit)不失普遍性。定义5。参与方i的策略是一系列函数φi=(φit)t,其中φit:(Θi)×Si×Ξi→ xi如果φ为,则策略φ为最优∈ ψ对于所有t。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:00:39
政策文件φ=(φi)i∈如果φIis对所有i都是最优的,那么Iis是最优的∈ I.让H (S×Ξ×X×Y)∞表示一组历史,其中任何历史h=(s,ξ,x,y,…,st,ξt,xt,yt…)∈ H满足了可行性限制:尽管如此∈ 一、 yit=fi(xit,x-它,ω)对于某些ω∈ 补充(pOhm|Si(·| sit))表示所有t。设Pu,φ表示由先验u=(ui)i引起的H上的概率分布∈一、 政策文件φ=(φI)I∈I.让(ut)tdenote的序列为ut:H→ ×i∈我(Θi)因此,尽管如此≥ 1.我所做的一切∈ 一、 uit(h)=Bi(uit)递归定义的时间t的后部-1(h),坐下-1(h),xit-1(h),yit-1(h))所有h∈ H、 你坐哪儿-1(h)是playeri在t的信号- 1考虑到历史h,以及类似的脱欧-1(h)和yit-1(h)。定义6。给定政策文件φ=(φi)i的预期战略文件顺序∈随机变量σt:H的序列(σt)→ ×i∈我(Xi)尽管如此,我∈ 一、 以及所有(xi,si)∈ Xi×Si,σit(h)(Xi | Si)=Pξξi:φit(uit(h),si,ξi)=xi. (7) 预期策略文件σt描述了每个玩家在时间t对每个可能信号的行为;这是一个随机变量,因为它取决于玩家在时间t,ut时的信念,而这反过来又取决于过去的历史。根据假设1(ii)-(iii),存在θ∈ Θ和一个包含它的开放球,使得球中任何θ的Qiθ>0。因此,对于任何ui,都可以很好地定义贝叶斯算子∈ (Θi)。此外,根据假设1(iii),这样的θ在Θ中是稠密的,因此贝叶斯算子映射(Θi)进入自身。声称玩家行为稳定的一个合理标准是,他们的终止行为以正概率稳定(参见Fudenberg和Kreps,1993)。定义7。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:00:42
如果预期策略序列(σt)t以正概率[或概率1]收敛到σ,即Pu,φ,则策略文件σ在政策文件φ下是稳定的[或强稳定的]极限→∞kσt(h)- σk=0> 0[或=1]。引理2说,如果行为稳定到一个策略文件σ,那么,对于每一层i,信念变得越来越集中于Θi(σ)。这一结果将错误学习(Berk(1966)、Bunke和Milhaud(1998))统计数据的发现扩展到具有主动学习的环境(即,玩家从自身行为内生产生的数据中学习)。出现了三个新问题:(i)以前的结果需要扩展到非i.i.d.和内生数据的情况;(ii)不明显的是,稳态信念可以基于稳态行为来描述,与游戏路径无关(假设1在这里起着重要作用;示例见第5节);(iii)我们允许wKLD功能不受限制,以便玩家可以相信其他玩家遵循纯粹的策略。引理2。假设对于一个政策文件φ,对于集合H中的所有历史,预期策略序列(σt)t收敛于σ 使得Pu,φ(H)>0。然后,对于所有开放集用户界面 Θi(σ),limt→∞uit(Ui)=1,a.s.-Pu,H中的φ。见附录。引理2的证明简图如下(为了减轻符号负担,我们省略了i下标)。考虑一个武断的问题 > 0和一个开放集Θ(σ)  定义为 Θ(σ)的距离。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:00:45
Θ的补码后面的时间t(σ) ,ut(Θ\\Θ)(σ) ),可以表示为Θ\\Θ(σ) Qt-1τ=0Qθ(yτ| sτ,xτ)u(dθ)ΘQt-1τ=0Qθ(yτ| sτ,xτ)u(dθ)=(σ) etKt(θ)u(dθ)\'ΘetKt(θ)u(dθ)例如,如果玩家1认为玩家2用概率θ和概率θ玩A,用概率1玩B-θ、 如果玩家2以正概率玩B,则wKLD函数在θ=1处是一致的。式中,Kt(θ)等于减去对数似然比,-tPt-1τ=0lnQστ(yτ| sτ,xτ)Qθ(yτ| sτ,xτ)。这个表达式和简单的代数意味着ut(Θ\\Θ)(σ)) ≤'Θ\\Θ(σ) 对于任何δ>0和θ,et(Kt(θ)+K(σ,θ)+δ)u(dθ)\')η(σ)et(Kt(θ)+K(σ,θ)+δ)u(dθ)∈ Θ(σ)和η>0被视为“小”。粗略地说,RHS中分子的积分被用来表示-与Θ(σ)分离,而分母中的积分则接管了与Θ(σ)“η-接近”的点。直观地说,如果Kt(·)的行为与-K(σ,·),存在有效的对称δ>0和η>0,使得Kt(θ)+K(σ,θ)+δ对于所有θ都是负的,它们是“-与Θ(σ)分离,且所有θ为正,与Θ(σ)为“η-接近”。因此,如果Θη(σ)在先验条件下具有正测度,则算数收敛到零,而分母发散到单位。证明的非标准部分包括确定Θη(σ)在先验条件下具有正度量,这依赖于假设1,并且确实Kt(·)的行为渐近类似-K(σ,·)。借助于Fatou引理,对于θ∈ Θη(σ)表示Kt(θ)到-K(σ,θ);这是在附录中的ClaimB(i)中完成的,它依赖于非iid变量的LLN参数。另一方面,在θ上∈ Θ \\Θ(σ) ,我们需要控制Kt(.)的渐近行为一致地,能够交换极限和积分。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:00:48
在附录中的权利要求B(ii)和B(iii)中,我们确定存在α>0,使得渐近andoverΘ\\Θ(σ) ,Kt(·)<-K(σ,θ)- α.引理2意味着后验概率的支持收敛,但后验概率不必收敛。然而,我们总能找到一系列收敛的后验概率。通过信念中行为的连续性和玩家近视的假设,稳定的策略文件必须是静态最优的。因此,当参与者遵循最优策略时,我们得到了稳定策略集的以下特征。定理2。假设一个策略变量σ在扰动博弈的最优策略变量下是稳定的。σ是扰动博弈的Berk-Nash均衡。证据设φ表示σ稳定的最优策略函数。通过引理2,存在H 当Pu,φ(H)>0时,对于所有H∈ H、 极限→∞σt(h)=σ和极限→∞uit(Ui)=1代表所有i∈ 我和所有开放集用户界面 Θi(σ);对于剩余的证据,fix any h∈ H.尽管我∈ 一、 压缩性(i)意味着子序列的存在,我们将其表示为(uit(j))j,使得uit(j)弱地收敛到ui∞(限值可能取决于h)。最后,我们展示,尽管我∈ I:(I)uI∞∈ (Θi(σ)):假设不是,所以存在^θi∈ 补充(ui)∞) 这样^θi/∈ Θi(σ)。然后,由于Θi(σ)是闭合的(由引理1),因此存在一个开放的setUi Θi(σ)与闭包^i^θi/∈“用户界面。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:00:51
然后我∞(\'Ui)<1,但这与ui∞“用户界面≥ 林苏普→∞uit(j)“用户界面≥ 林杰→∞uit(j)(Ui)=1,其中firstinequality成立,因为¨Ui是闭合的,而uit(j)收敛(弱)到ui∞.(ii)对于给定ui的扰动对策,σii是最优的∞∈ (Θi):σi(xi | si)=limj→∞σit(j)(h)(xi | si)=limj→∞Pξξi:xi∈ ψi(uit(j),si,ξi)= Pξξi:xi∈ ψi(ui)∞, si,ξi),其中,第二个等式是因为φiis最优和ψiis单值,a.s.Pξi,第三个等式是因为标准连续性参数。4.3相反的结果OREM 2为伯克-纳什均衡提供了我们的主要理由:任何不是均衡的战略文件都不能代表优化参与者的限制行为。然而,定理2并不意味着行为稳定。众所周知,纳什均衡是伯克-纳什均衡的一个特殊情况,其收敛性是不保证的。因此,需要放松一些假设,以证明一般博弈的收敛性。Fudenberg和Kreps(1993)表明,对于纳什均衡的情况,可以通过放松最优性和允许玩家犯消失的优化错误来获得相反的结果。定义8。如果存在两个极限的正真值序列(εt),则策略文件φ是渐近最优的→∞εt=0,因此,对于所有i∈ 一、 全部(uI,si,ξI)∈ψis单值a.s.-Pξi由于ξ的集合#ψi(ui,si,ξi)>1的维数小于#xind,通过Pξi的绝对连续性,该集合的测度为零。Jordan(1993)证明了非收敛性对初始条件的选择是鲁棒的;贝内曼德·赫希(1999年)将这一发现复制到了乔丹游戏的不安版本中。在博弈论文献中,一般的全局收敛结果只在特殊的格网类中得到。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:00:54
零和、势和超模对策(Hoffauer和Sandholm,2002)。(Θi)×Si×Ξi,全部t,全部xi∈ Xi,E’Qiui(·si,xit)πi(xit,Yi)+ ξi(xit)≥ E|Qiui(·si,xi)πi(xi,Yi)+ ξi(xi)- εtwxit=φit(ui,si,ξi)。Fudenberg和Kreps(1993)的洞见是假设玩家很早就确信均衡策略是正确的策略,并继续使用这种策略,除非他们有足够有力的证据认为不是这样。而且,随着他们继续采取均衡策略,证据越来越让他们相信这是正确的做法。然而,这种想法不必适用于伯克-纳什均衡,因为如果模型被错误定义,信念可能不会收敛(参见伯克(1966)的例子)。然而,如果博弈是弱识别的,引理2和Fudenberg and Kreps(1993)的洞见可以结合起来,得到定理2的以下逆。勘误表(2019年11月19日):我们感谢山本裕一指出定理3的陈述应更正如下:定理3。假设σ是一个扰动博弈的Berk-Nash均衡,该扰动博弈在给定σ和let(¨ui)i的情况下是弱识别的∈Ibe是一个支持σ作为非平衡的信念文件。然后,对于任何满足ui(·|i(σ))的先验函数,对于所有i∈ 对于任何a>0,都存在一个渐近最优的政策文件φ,使得pu,φ(limt→∞kσt(h)- σk=0)>1- a、 证据。见在线附录B.5讨论假设1的重要性。下面的例子说明,如果假设1不成立,平衡可能不存在,引理2失败。单个代理选择动作x∈ {A,B}并得到结果y∈ {0, 1}.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:00:57
代理的模型由θ=(θA,θB)参数化,其中Qθ(y=1 | A)=θA和Qθ(y=1 | B)=θB。关于先验的陈述强调了我们选择的先验不会以一种使结果变得微不足道的方式退化。真正的模型是θ=(1/4,3/4)。然而,代理是错误的,并且认为θ=(0,3/4)和θ=(1/4,1/4)是可能的,即Θ={θ,θ}。特别是,假设1(iii)对参数值θ无效。假设A对于参数值θ是唯一最优的,B对于θ是唯一最优的(不需要关于支付的更多细节)。伯克-纳什均衡不存在:如果A以正概率进行博弈,那么wKLD在θ处是一致的(即,给定A,θ不能使y=1合理化),θ是最好的;但是,A不是最优的。如果B的概率为1,那么θ是最好的;但是B不是最优的。此外,引理2失败了:假设游戏路径收敛于纯策略B。给定B的最佳函数是θ,但后一个不需要弱收敛于θ上的退化概率分布;有可能,在游戏的过程中,特工尝试了动作A,并观察到y=1,在这种情况下,后路会立即将概率1分配给θ。有远见的探员。在动态模型中,我们假设玩家近视。在在线附录C中,我们将定理2推广到非短视玩家的情况,他们用信念作为状态变量来解决动态优化问题。定理2证明中使用的一个关键事实是,短视的最优行为在信念中是连续的。非近视最佳行为在信念上也是连续的,但问题是,如果玩家仍然有尝试的动机,它可能与稳态下的近视行为不一致。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:01:01
我们通过要求游戏是弱识别的来证明扩展,这保证了玩家没有在稳态下进行实验的动机。大人口模型。该框架假设有固定数量的玩家,但通过关注静态主观模型,排除了玩家试图影响彼此游戏的“重复游戏”方面。在在线附录D中,我们对均衡概念进行了调整,以适应在每个玩家的角色中有大量代理的情况,从而使代理具有影响彼此游戏的可忽略的意识。广泛形式的游戏。我们的结果支持另一种时机,即playeri承诺执行信号应急行动计划(即策略),并观察实现的信号SIA和后果yiex post。特别是,伯克-纳什均衡适用于广泛形式的博弈,前提是参与者通过选择或有行动计划进行竞争,并且知道广泛形式。但正确的方法是假设1(iii)成立,如果对于某些ε>0,θ=(ε,3/4)也适用于所有ε<0的情况≤ ε.不太清楚玩家是否对广泛形式有错误的看法(例如,他们甚至不知道他们可以使用的策略集),或者玩家是否按顺序玩游戏(例如,我们需要在每个信息集定义和更新信念)。扩展到广泛形式的游戏是留给未来的工作。与有限理性文献的关系。通过提供一种明确潜在错误的语言,我们为在有限理性的不同模型之间进行选择提供了一些指导。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:01:04
例如,我们可以在例2.3中模拟观察到的讲师行为,直接假设她相信批评会提高绩效,而表扬会恶化绩效。但将这种观察到的信念外推到其他情况可能会导致错误的结论。相反,我们假设我们认为的是一个似是而非的误判(即,未能解释回归到平均值),然后作为上下文的函数,从内生角度推导出信念。我们在论文中提到了几个有限理性的例子,这些例子可以通过不明确的内生学习实现。文献中的其他例子也可以被视为使用wKLD度量来限制信念,但超出了本文的范围,因为互动是由价格介导的,或者因为问题是动态的(我们关注的是静态问题的重复)。例如,Blume和Easley(1982年)以及Rabin和Vayanos(2010年)使用似然函数的极限明确地刻画了线性函数,而Bray(1982年)、Radner(1982年)、Sargent(1993年)和Evans和Honkapohja(2001年)则特别关注使用错误模型的OLS学习。Piccione和Rubinstein(2003年)、Eyster和Piccione(2013年)以及Spiegler(2013年)研究了动态环境中的模式识别和对信念的不确定性要求,这些信念可以被解释为最小化WKLD度量。在奥斯本、鲁宾斯坦(1998)和斯皮格勒(2006)的抽样均衡中,由于从有限的样本中学习,而不是从错误的学习中学习,信念可能是不正确的。有限理性的其他例子似乎并不天生适合于错误的学习,包括信息处理中的偏见dueJehiel(1995)考虑了重复交替移动游戏的类别,并假设玩家只能预测未来有限的时间段;学习基金会见Jehiel(1998)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:01:07
Jehiel和Samet(2007)考虑了具有perfectinformation的广泛形式游戏的一般类,并假设玩家通过将节点划分为相似类来简化游戏。在这两种情况下,玩家都需要有正确的信念,因为他们对游戏的看法有限或简单。这种假设对应于一个单态集合,因此从一开始就定义了信念,没有留下学习的空间。这种方法在过去的工作中很常见,这些工作假设代理具有错误的特定模型,但没有了解参数值,例如Barberis等人(1998年)。计算复杂性(如Rubinstein(1986)、Salant(2011))、有限内存(如Wilson,2003)、自欺欺人(如Bénabou和Tirole(2002)、Compte和Postlewaite(2004))或基于稀疏性的优化(Gabaix(2014))。参考Najjar,N.,“作为统计学家的决策者:多样性、模糊性和学习”,计量经济学,2009,77(5),1371-1401。和M.Pai,《粗决策和过度匹配》,《经济理论杂志》,即将出版,2013年。Aliprantis,C.D.和K.C.Border,《有限维分析:搭便车指南》,Springer Verlag,2006年。Aragones,E.,I.Gilboa,A.Postlewaite和D.Schmeidler,“无事实的学习”,《美国经济评论》,2005年,95(5),1355-1368年。Arrow,K.和J.Green,“贝叶斯环境下的期望均衡注释”,数学研究所,社会科学工作文件331973号。N.Barberis、A.Shleifer和R.Vishny,“投资者情绪的模型”,《金融经济学杂志》,1998年,49(3),307–343。Battigalli,P.,米兰博科尼大学内乔奇·内尔·西图阿齐奥尼·西图阿齐奥·西图阿齐奥西亚利地区均衡成分研究所,1987年。,S.Cerreia Vioglio、F.Maccheroni和M。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:01:09
Marinacci,《自确认平衡和模型不确定性》,2012年技术报告。贝纳布,罗兰和让·蒂罗尔,“自信和个人动机”,《经济学季刊》,2002年,117(3),871-915。Benaim,M.和M.W.Hirsch,“扰动博弈中的博弈产生的混合均衡和动力系统”,博弈与经济行为,1999年,29(1-2),36-72。Michel Benaim,“随机近似算法的动力学”,摘自《Seminairede Probabilites XXXIII》,数学课堂讲稿第1709卷,Springer BerlinHeidelberg,1999年,第1-68页。Berk,R.H.,“模型不正确时后验分布的限制行为”,《数理统计年鉴》,1966年,37(1),51-58。Bickel,Peter J,Chris AJ Klassen,Peter J Bickel,Y Ritov,J Klassen,Jon A Wellner和YA\'Acov Ritov,半参数模型的有效和自适应估计,约翰霍普金斯大学出版社巴尔的摩,1993年。比林斯利,P.,概率与度量,威利,1995年。布鲁姆、L.E.和D.伊斯利,“学会理性”,经济理论杂志,1982年,26(2),340-351。布雷,M.,“学习、估计和理性预期的稳定性”,《经济理论杂志》,1982年,26(2),318-339。Bunke,O.和X.Milhaud,“可能不正确模型下Bayes估计的渐近行为”,《统计年鉴》,1998年,26(2),617-644。Compte、Olivier和Andrew Postlewaite,“信心增强绩效”,《美国经济评论》,2004年,第1536-1557页。Dekel,E.,D.Fudenberg和D.K.Levine,“学习玩贝叶斯游戏”,游戏与经济行为,2004,46(2),282–303。Diaconis,P.和D.Freedman,“关于Bayes估计的一致性”,统计年鉴,1986年,第页。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:01:12
1–26.Doraszelski,Ulrich和Juan F Escobar,“动态随机博弈中的正则马尔可夫完美均衡理论:泛型、稳定性和纯化”,理论经济学,2010年,5(3),369–402。《概率:理论与实例》,剑桥大学出版社,2010年。Easley,D.和N.M.Kiefer,“用未知参数控制随机过程”,计量经济学,1988年,第1045-1064页。Esponda,I.,“逆向选择经济中的行为均衡”,《美国经济评论》,2008年,98(4),1269-1291。和D.Pouzo,“利用私人信息在投票环境中实现均衡的学习基金会”,工作文件,2011年。Esponda,I.和D.Pouzo,“伯克-纳什均衡:用错误模型建模试剂的框架”,ArXiv 1411.1152,2014年11月。Evans,G.W.和S.Honkapohja,《宏观经济学中的学习与期望》,普林斯顿大学出版社,2001年。Eyster,E.和M.Rabin,“诅咒的均衡”,计量经济学,2005年,73(5),1623-1672年。Eyster、Erik和Michele Piccione,“在不完全和多样性认知下的资产定价方法”,计量经济学,2013,81(4),1483-1506。Freedman,D.A.,《离散情形下Bayes估计的渐近行为》,《数理统计年鉴》,1963年,34(4),1386-1403年。Fudenberg,D.和D.Kreps,“学习混合均衡”,游戏和经济行为,1993年,5320-367。D.K.Levine,“自我确认均衡”,计量经济学,1993年,第523-545页。《稳态学习与纳什均衡》,计量经济学,1993年,547-573页。《游戏学习理论》,第二卷,麻省理工学院出版社,1998年。《学习与均衡》,经济学年鉴,2009年,1385-420页。D.M.Kreps,“学习、实验和平衡的理论”,技术报告,mimeo 1988。以及“广泛形式的学习游戏I。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:01:15
自我确认均衡,《游戏与经济行为》,1995年,8(1),20-55。《基于稀疏性的有限理性模型》,《经济学季刊》,2014年,129(4),1661-1710。Harsanyi,J.C.,“随机干扰支付的博弈:混合策略均衡点的新原理”,国际博弈论杂志,1973年,2(1),1-23。赫希,M.W.,S.斯梅尔和R.L.德瓦尼,《微分方程,动力学系统和混沌导论》,爱思唯尔学术出版社,2004年。Hoffauer,J.和W.H.Sandholm,“关于随机效应的全球收敛”,计量经济学,2002,70(6),2265–2294。Jehiel,P.,“基于类比的预期均衡”,《经济理论杂志》,2005年,123(2),81-104。D.Samet,“估值均衡”,理论经济学,2007年,2(2),163-185。和F.Koessler,“用基于类比的预期重新审视不完全信息的博弈”,博弈与经济行为,2008,62(2),533–557。Philippe Jehiel,“学习玩有限预测均衡”,游戏与经济行为,1998年,22(2),274-298。Phillippe Jehiel,“重复交替博弈中的有限期预测”,《经济理论杂志》,1995年,67(2),497-519。Jordan,J.S.,“学习混合策略纳什均衡的三个问题”,游戏与经济行为,1993年,5(3),368-386。Kagel,J.H.和D.Levin,“公共价值拍卖中的赢家诅咒和公共信息”,《美国经济评论》,1986年,第894-920页。Kalai,E.和E.Lehrer,“理性学习导致纳什均衡”,计量经济学,1993年,第1019-1045页。Kirman,A.P.,“企业对需求状况的学习”,摘自R.H.Day和T。格罗夫斯主编,《适应性经济模型》,学术出版社1975年,第137-156页。Kreps,D.M.和R.Wilson,“顺序均衡”,计量经济学,1982年,第863-894页。库尔贝克,S.和R.A。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:01:18
Leibler,“关于信息和效率”,数学统计年鉴,1951,22(1),79-86。Kushner,H.J.和G.G.尹,随机逼近和递归算法及应用,Springer Verlag,2003。McLennan,A.,“长期的价格分散和不完全学习”,《经济动态与控制杂志》,1984年,第7(3),331-347页。Nyarko,Y.,“在不规范模型中的学习和周期的可能性”,经济理论杂志,1991年,55(2),416-427。,“关于贝叶斯最优控制问题中价值函数的凸性”,经济理论,1994,4(2),303–309。Osborne,M.J.和A.Rubinstein,“程序理性玩家的游戏”,《美国经济评论》,1998年,88834-849。Piccione,M.和A.Rubinstein,“对具有不同能力识别均衡模式的机构的经济互动进行建模”,《欧洲经济协会杂志》,2003年,1(1),212–223。波拉德博士,《测量理论概率的用户指南》,剑桥大学出版社,2001年。拉宾,M.,“相信小数定律的人的推论”,《经济学季刊》,2002年,117(3),775-816。和D.Vayanos,《赌徒和热手谬论:理论与应用》,《经济研究评论》,2010年,77(2),730-778。R.拉德纳,《不确定性下的均衡》,北荷兰出版公司《数学经济手册》第二卷,1982年。罗斯柴尔德,M.,“市场定价的两臂强盗理论”,《经济理论杂志》,1974年,9(2),185-202。鲁宾斯坦,A.和A。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:01:21
沃林斯基,“合理化猜想均衡:纳什与合理化之间”,博弈与经济行为,1994,6(2),299–311。Ariel Rubinstein,“有限自动机扮演重复的囚徒困境”,经济理论杂志,1986年,39(1),83-96。Salant,Y.,“选择规则的程序分析及其在有限理性中的应用”,《美国经济评论》,2011年,101(2),724–748。《宏观经济学中的有限理性》,牛津大学出版社,1993年。,《征服美国帝国》,普林斯顿大学出版社,1999年。Schwartzstein,J.,“选择性注意和学习”,工作论文,2009年。塞尔滕,R.,“重新审视广泛博弈中均衡点的完备性概念”,《国际博弈论杂志》,1975年,4(1),25-55。Sobel,J.,“非线性价格和价格接受行为”,《经济行为与组织杂志》,1984年,5(3),387–396。斯皮格勒,R.,“江湖郎中的市场”,《经济研究评论》,2006年,第731113-1131页。,《安慰剂改革》,美国经济评论,2013年,103(4),1490-1506。,“贝叶斯网络和有界理性预期”,工作文件,2014年。《第六届伯克利数理统计与概率研讨会论文集,第2卷:概率论》,加州大学出版社,加州伯克利,1972年,第583-602页。Tversky,T.和D.Kahneman,“可用性:判断频率和概率的启发式”,认知心理学,1973年,5207-232。White,Halbert,“误判模型的最大似然估计”,计量经济学:计量经济学学会杂志,1982年,第页。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:01:25
1–25.Wilson,A.,“信息处理中的有限记忆和偏见”,工作论文,2003年。附录子=(四、xi、易)∈ Si×Xi×Yi:Yi=fi(Xi,x-i、 ω),x-我∈ 十、-i、 ω∈ 补充(pOhm|Si(·| Si)).对于所有子=(四,xi,一)∈ Zi,定义Piσ(Zi)=Qiσ(yi | si,xi)σi(xi | si)pSi(si)。我们有时滥用符号,写“气σ(zi)”≡ Qiσ(yi | si,xi),与Qiθi类似。下面的证明中使用了下面的声明。索赔A.尽管我∈ I:(I)存在θI*∈ 土地∞ 以至于,σ ∈ ∑,Ki(σ,θi)*) ≤“K;(ii)固定任何θi∈ Θi(σn)确保Qiθi(zi)>0子∈ 齐兰林→∞σn=σ。然后limn→∞Ki(σn,θi)=Ki(σ,θi);(iii)Kiis(联合)lowersemicontinuous:固定任何(θin)和(σn)n,以使limn→∞θin=θi,limn→∞σn=σ。然后是lim infn→∞Ki(σn,θin)≥ K(σ,θi);(iv)设ξibe是R#xi中的一个随机向量,具有绝对连续的概率分布Pξ。然后(四、十一)∈ Si×Xi,ui7→σi(ui)(xi | si)=Pξξi:xi∈ arg最大值xi∈谢琪ui(·| si,\'xi xi)[πi(\'xi,Yi)]+ξi(\'xi xi)是连续的。证据(i) 根据假设1和Zi的完整性,存在θi*∈ Θ和α∈ (0,1)使得Qiθi*(子)≥ α 子∈ 子。因此σ ∈ ∑,K(σ,θ)*) ≤ -E′Piσ[ln Qiθ*(Zi)]≤ -lnα。(ii)Ki(σn,θi)-K(σ,θi)=Pzi∈子\'Piσn(zi)ln Qiσn(zi)-\'Piσ(zi)ln Qiσ(zi)+πσ(zi)-πσn(zi)ln Qiθi(zi). RHS中的第一项收敛为0,因为limn→∞σn=σ,Qσ是连续的,x ln x是连续的十、∈ [0,1]。第二项收敛到0,因为limn→∞σn=σ,πσ是连续的,ln Qiθi(zi)∈ (-∞, 0] 子∈ 子。(iii)Ki(σn,θin)-K(σ,θi)=Pzi∈子\'Piσn(zi)ln Qiσn(zi)-\'Piσ(zi)ln Qiσ(zi)+πσ(zi)ln Qiθi(zi)-πσn(zi)ln Qiθin(zi). RHS中的第一项收敛到0(与inpart(ii)中的参数相同)。证据的结论是,子∈ Zi,lim infn→∞-πσn(zi)ln Qiθin(zi)≥ -πσ(zi)ln Qiθi(zi)。(8) 假设lim infn→∞-πσn(zi)ln Qiθin(zi)≤ M<∞ (如果不是,(8)则无关紧要)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:01:28
然后(i)`Piσn(zi)→πσ(zi)>0,在这种情况下(8)保持相等(通过θi7的连续性)→ Qiθi)或(ii)`Piσn(zi)→πσ(zi)=0,在这种情况下(8)成立,因为其RHS为0(按照惯例,0 ln 0=0),其LHS始终为非负。(iv)证明是标准的,因此被省略。引理1的证明。第(一)部分。注意thatKi(σ,θi)≥ -X(四、十一)∈思欣EQiσ(·si,xi)Qiθi(Yi | si,xi)Qiσ(Yi | si,xi)σi(xi | si)pSi(si)=0,其中不等式源自Jensen不等式和ln(·)的严格凹性,当且仅当Qiθi(·| si,xi)=Qiθi(·| si,xi)时,它成立(si,xi)比如σi(xi | si)>0(回想一下,假设pSi(si)>0)。第(二)部分。Θi(σ)是非空的:根据权利要求A(i),K<∞ 使得极小值在约束集中{θi∈ Θi:Ki(σ,θi)≤ K} 。因为Ki(σ,·)在紧集上是连续的,所以存在一个极小值。Θi(σ)是上半连续的(uhc):将任意(σn)和(θin)固定在limn上→∞σn=σ,limn→∞θin=θi,θin∈ Θi(σn)n、 我们证明了θi∈ Θi(σ)(因此Θi(·)有一个闭图,通过Θi的紧性,它是uhc)。假设,为了得到一个矛盾,θi/∈ Θi(σ)。根据权利要求A(i),存在^θi∈ Θi和ε>0,如Ki(σ,^θi)≤ Ki(σ,θi)- 3ε和Ki(σ,^θi)<∞. 根据假设1,(θij)jwithlimj→∞^θij=^θi,j、 Qi^θij(zi)>0子∈ 子。我们证明了序列中有一个元素,^θiJ,它“比”θingivenσn“做得更好”,这是一个矛盾。因为(σ,^θi)<∞, Ki(σ,·)的连续性意味着存在足够大的J,使得Ki(σ,θiJ)- Ki(σ,^θi)≤ ε/2. 此外,适用于θi=^θij的权利要求A(ii)意味着存在Nε,Jsuch,N≥ Nε,J,Ki(σn,^θiJ)- Ki(σ,θiJ)≤ ε/2. 因此N≥Nε,J,Ki(σn,^θiJ)- Ki(σ,^θi)≤Ki(σn,^θiJ)- Ki(σ,θiJ)+Ki(σ,θiJ)- Ki(σ,^θi)≤ ε.因此,Ki(σn,^θiJ)≤ Ki(σ,^θi)+ε≤ Ki(σ,θi)- 2ε. (9) 假设Ki(σ,θi)<∞.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:01:31
根据权利要求A(iii),nε≥ Nε,Jsuch the Ki(σNε,θinε)≥Ki(σ,θi)- ε. 这个结果和表达式(9)暗示了Ki(σnε,^θiJ)≤ K(σnε,θinε)- ε.但这与ε中的θ相矛盾∈ Θi(σnε)。最后,如果Ki(σ,θi)=∞, 索赔A(iii)暗示:nε≥ Nε,Jsuch the Ki(σNε,θinε)≥ 2K,其中K是索赔人(i)中定义的界限。但这也与ε中的θ相矛盾∈ Θi(σnε)。Θi(σ)是紧的:如上所示,Θi(·)有一个闭合图,因此Θi(σ)是一个闭合集。Θi(σ)的紧致性源于Θi的紧致性。定理1的证明。我们从两个方面证明了结果。第一部分。我们证明了扰动博弈中均衡的存在性(见第4.1节)。设Γ:×i∈我(Θi)=> ×i∈我(i)是这样的通信:,u=(ui)i∈我∈ ×i∈我(Θi),Γ(u)=×i∈我 (Θi(σ(u)),其中σ(u)=(σi(ui))i∈我∈ ∑,定义为σi(ui)(xi | si)=Pξξi:xi∈ arg最大值xi∈谢琪ui(·思,\'xi)πi((R)xi,Yi)+ ξi(`xi)(10)(十一、四)∈ Xi×Si。注意,如果u*∈ ×i∈我(i)使*∈ Γ(u*), 然后σ*≡(σi(ui)*))我∈这是一个扰动博弈的均衡。我们证明了这一点*通过检查Kakutani Fan-Glicksberg不动点定理的条件,证明存在:(i)×i∈我(Θi)是紧的、凸的和局部凸的Hausdorff:集合(Θi)是凸的,因为Θi是紧的(i)在弱拓扑下也是紧的(Aliprantisand Border(2006),定理15.11)。根据蒂乔诺·弗夫定理,×i∈我(Θi)也很紧凑。最后,该集在弱拓扑下也是局部凸的;(ii)Γ具有凸的、非空的图像:很明显 (Θi(σ(u))是凸值的u. 此外,通过引理1,Θi(σ(u))是非空的u; (iii)Γ有一个闭合图:让(un,^un)n使得∈ Γ(un)和un→ u和^un→ ^u(弱拓扑下)。由索赔人(iv)提供,ui7→ σi(ui)是连续的。因此,σn≡ (σi(uin))i∈我→ σ ≡ (σi(ui))i∈I.ByLemma 1,σ7→ Θi(σ)是uhc;因此,根据Aliprantis和Border(2006)中的定理17.13,σ7→ ×i∈我 (Θi(σ))也是uhc。因此^u∈ ×i∈我 (Θi(σ))=Γ(u)。第二部分。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:01:34
修正由扰动概率(Pξ,n)n索引的扰动对策序列。在第1部分中,有一个相应的固定点序列(un)n,使得un∈ ×i∈我 (Θi(σn))n、 σn在哪里≡ (σi(uin,Pξ,n))i∈I(见等式(10),其中我们现在明确地解释了对Pξ,n的依赖性)。根据紧性,存在(un)和(σn)n的子序列分别收敛于u和σ。自σ7以来→ ×i∈我 (Θi(σ))是uhc,那么u∈ ×i∈我 (Θi(σ))。现在我们证明,如果我们选择(Pξ,n)n,ε>0,limn→∞Pξ,n(kξ)≥ ε) =0,则σ是最优的,在未受干扰的博弈中给定u,这就建立了未受干扰博弈中均衡的存在性。假设不存在,则存在i,si,xi,^xi和ε>0,从而σi(xi | si)>0和E'Qiui(·'si,xi)[πi(xi,Yi)]+4ε≤ E’Qiui(·si,^xi)[πi(^xi,Yi)]。通过ui7的连续性→“我知道limn→∞uin=ui,确认一下,N≥ n、 E|Qiuin(·si,xi)[πi(xi,Yi)]+2ε≤ E“Qiuin(·| si,^xi)[πi(^xi,Yi)]。然后从(10)和limn开始→∞Pξ,n(kξ)≥ ε) =0,那个limn→∞σi(uin,Pξ,n)(xi | si)=0。但这与Slimn相矛盾→∞σi(uin,Pξ,n)(xi | si)=σi(xi | si)>0。命题3的证明。在下一段中,我们将证明以下结果:对于所有σ和θiσ∈ Θi(σ),(a)QiOhm,θiσ(ω| si)=pOhm|所有Si的Si(ω| Si)∈ Si,ω∈ Ohm和(b)QiX-i、 θiσ(x)-i |αi)=Pω∈OhmPOhm|对于所有αi,Ai(ω|αi)Qj6=iσj(xj | sj(ω))∈哎,x-我∈ 十、-我
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:01:37
Berk-Nash和ABEE之间的等价性直接从(a)、(b)中得出,最后一个结论是,由于弱拓扑是由一系列形式的半范数引起的:ρ(u,u)=|Eu[f],因此,具有信号sian和信念的参与者i的预期效用也随之产生- Eu[f]|对于f连续且有界的任意u和uin(Θi)。等式pω∈Ohm气Ohm,θiσ(ω| si)Px-我∈十、-iQiX-i、 θiσ(x)-i |αi(ω))πi((R)xi,x-i、 ω)。(a)和(b)项的证明:-Ki(σ,θi)等于,直到一个常数,Xsi,~w,~x-伊恩气Ohm,θi(∧ω| si)QiX-i、 θi(~x)-i |αi("oω))Yj6=iσj(~xj | sj(~ω))pOhm|Si(ω| Si)pSi(Si)=Xsi,ωln气Ohm,θi(ω| si)POhm|Si(ω| Si)pSi(Si)+X |X-i、 αi∈艾琳齐克斯-i、 θi(~x)-i |αi)X~ω∈αiYj6=iσj(~xj | sj(~ω))pOhm(~ω).可以直接检查使上述表达式最大化的任何参数值是否满足(a)和(b)。引理2的证明。该证明使用了在该证明之后陈述和证明的权利要求B。这有助于确定极限→∞Θidi(σ,θi)uit(dθi)=0 a.s.in H,其中di(σ,θi)=inf^θi∈Θi(σ)kθi-^θik。修好我∈ 我和h∈ H.然后,根据贝叶斯规则,^Θidi(σ,θi)uit(dθi)=Θidi(σ,θi)Qt-1τ=0Qiθi(yiτ| siτ,xiτ)Qiστ(yiτ| siτ,xiτ)ui(dθi)\'iQt-1τ=0Qiθi(yiτ| siτ,xiτ)Qiστ(yiτ| siτ,xiτ)ui(dθi)='Θidi(σ,θi)etKit(h,θi)ui(dθi)'ietKit(h,θi)ui(dθi),其中第一个等式由假设1定义,ui的完全支持,事实上,Pu,φ(h)>0意味着所有Qiστ项为正,其中我们定义了kit(h,θi)=-tPt-1τ=0lnQiστ(yiτ| siτ,xiτ)Qiθi(yiτ| siτ,xiτ),表示第二个等式。对于任何大于0的α,定义Θiα(σ)≡ {θi∈ Θi:di(σ,θi)<α}。然后,对于所有ε>0和η>0,Θidi(σ,θi)uit(dθi)≤ε+CAit(h,σ,ε)Bit(h,σ,η),其中C≡ supθi,θi∈Θikθi- θik<∞ (因为Θiis有界)和whereit(h,σ,ε)=Θi\\Θiε(σ)etKit(h,θi)ui(dθi)和Bit(h,σ,η)=Θiη(σ)etKit(h,θi)ui(dθi)。本文的结论是,对于所有(非常小的)ε>0,ηε>0这样的极限→∞Ait(h,σ,ε)/Bit(h,σ,ηε)=0。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:01:40
这个结果是通过几个步骤实现的。第一ε>0,定义Kiε(σ)=inf{Ki(σ,θi)|θi∈ Θi \\Θiε(σ)}和αε=(Kiε(σ)- Ki(σ))/3,其中Ki(σ)=infθi∈ΘiKi(σ,θi)。通过Ki(σ,·)的连续性,存在ε和α等,ε ≤ ε, 0 < αε≤ α < ∞. 从今往后,让ε≤ ε. 它遵循thatKi(σ,θi)≥ Kiε(σ)>Ki(σ)+2αε(11)θ等于di(σ,θi)≥ ε. 此外,通过Ki(σ,·)的连续性,ηε>0,因此,θi∈如果对于某些θi,对于某些τ,Qiθi(yiτ| siτ,xiτ)=0∈ {0,…,t- 1} 然后我们定义Kit(h,θi)=-∞和经验tKit(h,θi)= 0.Θiηε,Ki(σ,θi)<Ki(σ)+αε/2。(12) 第二,让我=θi∈ Θi:Qiθi(yiτ| siτ,xiτ)>0表示所有τ和^Θiηε(σ)=^Θi∩Θiηε(σ)。我们现在证明ui(^Θiηε(σ))>0。根据引理1,Θi(σ)是非空的。匹克尼θi∈ Θi(σ)。根据假设1,(θin)ninΘisuch that limn→∞θin=θiandQiθin(yi | si,xi)>0易∈ 菲(Ohm, xi,X-i) 所有(四、十一)∈ Si×Xi。特别地,θi,θi的连续性存在于^Θiηε(σ)。通过完全支持,ui(^Θiηε(σ))>0。接下来,请注意,lim inft→∞Bit(h,σ,ηε)et(Ki(σ)+αε)≥ lim inft→∞^^iηε(σ)et(Ki(σ)+αε+Kit(h,θi))ui(dθi)≥^^Θiηε(σ)elimt→∞t(Ki(σ)+αε-Ki(σ,θi))ui(dθi)=∞ (13) a.s.在H中,第一个不等式如下,因为^iηε(σ) Θiηε(σ)和exp是一个正函数,第二个不等式来自Fatou引理和非iid随机变量的LLN,这意味着limt→∞Kit(h,θi)=-Ki(σ,θi)θi∈^Θi,a.s.inH(参见下面的权利要求B(i)),最后一个等式来自(12)和ui(Θiηε(σ))>0的事实。接下来,我们考虑术语Ait(h,σ,ε)。权利要求B(ii)和B(iii)(见下文)暗示不是这样的,T≥ T,Kit(h,θi)<-(Ki(σ)+(3/2)αε)θi∈ Θi \\Θiε(σ),a.s.inH。因此,limt→∞Ait(h,σ,ε)et(Ki(σ)+αε)=limt→∞^Θi \\Θiε(σ)et(Ki(σ)+αε+Kit(h,θi))ui(dθi)≤ ui(Θi\\Θiε(σ))limt→∞E-tαε/2=0。a、 在H。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:01:43
上述表达式和等式(13)暗示limt→∞Ait(h,σ,ε)/Bit(h,σ,ηε)=0 a.s.-Pu,φ。我们陈述并证明上述证明中使用的索赔B。对于任何ξ>0,定义Θiσ,ξ为θi∈ Θiσ,ξ当且仅当Qiθi(yi | si,xi)≥ ξ对于所有(si,xi,yi),如Qiσ(yi | si,xi)σi(xi | si)pSi(si)>0。索赔B.尽管我∈ I:(I)对于所有θI∈^Θi,limt→∞Kit(h,θi)=-Ki(σ,θi),a.s.inH;(ii)存在ξ*> 0和Tξ*以至于,T≥ Tξ*, Kit(h,θi)<-(Ki(σ)+(3/2)αε)θi/∈ H中的Θiσ,ξ,a.s;(iii)对于所有ξ>0,^Tξ使得,T≥^Tξ,Kit(h,θi)<-(Ki(σ)+(3/2)αε)θi∈ Θiσ,ξ\\Θiε(σ),a.s.在H.证明中:定义频率(zi)=tPt-1τ=0zi(ziτ)子∈ 子。Kit可以写成Kit(h,θi)=κi1t(h)+κi2t(h)+κi3t(h,θi),其中κi1t(h)=-T-1吨-1τ=0Pzi∈子zi(ziτ)-\'Piστ(zi)ln Qiστ(zi),κi2t(h)=-T-1吨-1τ=0Pzi∈Zi′Piστ(Zi)ln Qiστ(Zi),和κi3t(h,θi)=Pzi∈zifrejit(zi)ln Qiθi(zi)。下面的陈述几乎肯定适用于H,但我们省略了这个限定。首先,我们展示limt→∞κi1t(h)=0。定义liτ(h,zi)=zi(ziτ)-\'Piστ(zi)ln Qiστ(zi)和Lit(h,zi)=Ptτ=1τ-1liτ(h,zi)子∈ 子。修正任何错误∈ 子。我们证明了Lit(·,zi)将a.s.收敛到一个可积的有限函数Li∞(·,子)。为了证明这一点,我们使用鞅收敛结果。让htt表示直到timet的部分历史。自EPu,φ(·ht)lit+1(h,zi)= 0,然后EPu,φ(·ht)Lit+1(h,zi)= Lit(h,zi)和so(Lit(h,zi))是关于Pu,φ的鞅。接下来,我们展示suptEPu,φ[|Lit(h,zi)|]≤M代表M<∞. 注意EPu,φLit(h,zi)= EPu,φPtτ=1τ-2.liτ(h,zi)+Pτ>τliτ(h,zi)liτ(h,zi). 因为这是一个鞅差序列,对于τ>τ,EPu,φliτ(h,zi)liτ(h,zi)= 因此,EPu,φLit(h,zi)=Ptτ=1τ-2EPu,φliτ(h,zi).还应注意EPu,φ(·hτ-1)liτ(h,zi)≤ln Qiστ(zi)气στ(zi)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:01:47
因此,根据迭代期望定律,EPu,φLit(h,zi)≤Ptτ=1τ-2EPu,φhln Qiστ(zi)Qiστ(zi)i,它又在1上有界,因为(lnx)x≤ 1.十、∈ [0,1],我们使用(ln0)0=0的约定。因此,suptEPu,φ[|Lit |]≤ 1.根据理论。2.8在Durrett(2010)中,Lit(h,zi)将a.s.-Pu,φ收敛为有限Li∞(h,zi)。因此,byKronecker引理(Pollard(2001),第105页),limt→∞Pzi∈子T-1Ptτ=1zi(ziτ)-\'Piστ(zi)ln Qiστ(zi)= 因此,limt→∞κi1t(h)=0。接下来,考虑κi2t(h)。假设limt→∞σt=σ,并且Qiσln的连续性,Qiσinσ意味着limt→∞κi2t(h)=-P(si,xi)∈Si×XiEQσ(·| Si,xi)[ln Qiσ(Yi | Si,xi)]σi(xi | Si)pSi(Si)。κi1t,κI2t的极限意味着,γ > 0, ^tγ使得,T≥^tγ,κi1t(h)+κi2t(h)+X(si,xi)∈Si×XiEQσ(·| Si,xi)ln Qiσ(Yi | si,xi)σi(xi | si)pSi(si)≤ γ. (14) 现在我们通过刻画κi3t(h,θi)的极限来证明(i)-(iii)。(i) 无论如何∈ 子,频率(zi)-πσ(zi)≤T-1吨-1τ=0zi(ziτ)-\'Piστ(zi)+T-1吨-1τ=0\'Piστ(zi)-πσ(zi). RHS中的第一项变为0(证明基本上与The相同)。这个引理意味着对于序列(`t)tifPτ`τ<∞, 然后,τ=1bτbt′τ→ 0,其中(bt)是一个非递增的正实数值,它发散到∞. 我们可以用\'t\'应用引理≡ T-1ltandbt=t.证明κi等于0)。第二项为0,因为limt→∞σt=σ,且“Pi”是连续的。因此ζ > 0, ^tζ使得,T≥^tζ,子∈ 子,频率(zi)-πσ(zi)< ζ(15)因此,由于θi∈^Θi,limt→∞κi3t(h,θi)=P(si,xi)∈Si×XiEQσ(·| Si,xi)ln Qiθi(Yi | si,xi)σi(xi | si)pSi(si)。该表达式和(14)建立了第(i)部分。(ii)对于所有θi/∈ Θiσ,ξ,设ziθibe,使得πσ(ziθi)>0和Qiθi(ziθi)<ξ。到(15),tpiL/2suchT≥ tpiL/2,κi3t(h,θi)≤ 频率(ziθi)ln Qiθi(ziθi)≤ (piL/2)lnξθi/∈ Θiσ,ξ,其中piL=minZi{Piσ(zi):\'Piσ(zi)>0}。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:01:50
这个结果和(14)意味着,T≥ T≡max{tpiL/2,^t},Kit(h,θi)≤ -X(四、十一)∈Si×XiEQσ(·| Si,xi)ln Qiσ(Yi | si,xi)σi(xi | si)pSi(si)+1+piL/2lnξ≤ #Zi+1+齐鲁/2lnξ,(16)θi/∈ Θiσ,ξ,其中第二行来自σi(xi | si)pSi(si)≤ 1和x ln(x)∈ [-1, 0] 十、∈ [0,1]。此外,Ki(σ)<∞ αε≤ α < ∞ε ≤ ε表示(16)的RHS可以低于-(Ki(σ)+(3/2)αε)对于一些非常小的ξ*.(iii)对于任何ζ>0,设ζξ=-αε/(#Zi4 lnξ)>0。到(15),^tζξ使得,T≥^tζξ,κi3t(h,θi)≤X{zi:\'Piσ(zi)>0}freqit(zi)ln Qiθi(zi)≤X{zi:\'Piσ(zi)>0}πσ(zi)- ζξln Qiθi(zi)≤X(四、十一)∈Si×XiEQσ(·| Si,xi)ln Qiθi(Yi | si,xi)σi(xi | si)pSi(si)- #Ziζξlnξ,θi∈ Θiσ,ξ(自Qiθi(zi)≥ ξ 使πσ(zi)>0)。在上述表达式中,αε/4=-#Ziζlnξ和(14)意味着,T≥^Tξ≡ max{^tζξ,^tαε/4},Kit(h,θi)<-Ki(σ,θi)+αε/2θi∈ Θiσ,ξ。这个结果和(11)暗示了期望的结果。在线附录示例:逆向选择交易在本节中,我们提供示例2中交易环境的正式细节。5.让p∈ (A×V)为真实分布;我们使用下标,如pAandpV | A,来表示相应的边际分布和条件分布。设Y=A×V∪{} 表示可观察结果的空间,其中 这将是一种方便的方式来代表没有贸易的事实。我们用V表示随机变量取值∪{} ^V。请注意,本例中的状态空间是Ohm = A×V.部分反馈由函数fP:X×A×V表示→ Y使得fp(x,a,v)=(a,v)如果a≤ x和fP(x,a,v)=(a,) 如果a>x,则fF(x,a,v)=(a,v)表示完全反馈。在所有情况下,payoff由π:X×Y给出→R、 式中π(x,a,v)=v- 如果a≤ 否则为x和0。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:01:53
部分反馈情况下的目标分布QP为,十、∈ 十、(a、v)∈ A×V,QP(A,V | x)=p(A,V)1{x≥a} (十)以及,十、∈ 十、A.∈ A、 QP(A、, | x) =pA(a)1{x<a}(x)。对于完全反馈的情况,QF的客观分布是,十、∈ 十、(a、v)∈ A×V,QF(A,V | x)=p(A,V),以及,十、∈ 十、A.∈ A、 QF(A, | x) =0。买方了解除配电盘p以外的环境∈ (A×V)。然后,对于主观模型中的任何分布,Qθ,选择x的感知预期收益∈ X isEQθ(·X)[π(X,A,V)]=X(A,V)∈A×V{x≥a} (x)(v)- x) Qθ(a,v | x)。(17) 买方在参数集ΘI=(A) ×(五) (即独立信仰)或ΘA=×j(A) ×(五) (即基于类比的信念)在正文中定义。因此,结合反馈和参数集,我们有四种情况需要考虑,对于每种情况,我们写下了主体模型和wKLD函数。该死的平衡。反馈为F,参数集为ΘI。主观模型为,十、∈ 十、(a、v)∈ A×V,QCθ(A,V | x)=θA(A)θV(V),和,十、∈ 十、A.∈ A、 QCθ(A, | x) =0,其中θ=(θA,θV)∈ ΘI.这是一个基于类比的游戏。事实上,这个符号 在这个例子中没有必要,但我们保留它,以便在相同的结果空间中定义所有反馈函数。(17) ,x的预期收益∈ X isprθA(A)≤ x) (EθV[V]-x) ,(18)其中prθ表示关于θa的概率,EθV表示关于θV的期望。同样,对于所有(纯)策略x∈ 十、 wKLD函数是kc(X,θ)=EQF(·X)lnQF(A,^V|x)QCθ(A,^V|x)=X(a,v)∈A×Vp(A,v)lnp(A,v)θA(A)θv(v)。每x∈ 十、 θ(X)=(θA(X),θV(X))∈ ΘI=(A) ×(五) 式中,θA(x)=pa,θV(x)=pv是使KC(x,·)最小化的唯一参数值。与(18)一起,我们得到了正文中的方程∏cei。行为平衡(天真版)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:01:56
反馈为FP,参数集为ΘI。主观模型为,十、∈ 十、(a、v)∈ A×V,QBEθ(A,V | x)=θA(A)θV(V)1{x≥a} (十)以及,十、∈ 十、A.∈ A、 QBEθ(A, | x) =θA(A)1{x<A}(x),其中θ=(θA,θV)∈ ΘI.来自(17),来自x的预期收益∈ X如等式(18)所示。此外,对于所有(纯)策略x∈ 十、 wKLD函数是kbe(X,θ)=EQP(·X)lnQP(A,^V|x)QBEθ(A,^V|x)=X{a∈A:A>x}pA(A)lnpA(A)θA(A)+x{(A,v)∈A×V:A≤x} p(a,v)lnp(a,v)θa(a)θv(v)。每x∈ 十、 θ(X)=(θA(X),θV(X))∈ ΘI=(A) ×(五) 式中,θA(x)=pa和θV(x)(V)=pV | A(V | A≤ 十)五、∈ V是使kbe(x,·)最小的唯一参数值。与(18)一起,我们得到了正文中的方程∏。基于类比的期望均衡。反馈为F,参数集为ΘA。主观模型为,十、∈ 十、(a、v)∈ A×Vj,所有j=1。。。,k、 QABEEθ(a,v | x)=θj(a)θv(v),以及,十、∈ 十、A.∈ A、 QABEEθ(A, | x) =0,其中θ=(θ,…,θk,θV)∈ ΘA.这是一个基于类比的游戏。从(17)开始,感知到x的预期收益∈ X iskXj=1P rθV(V∈ Vj)prθj(A)≤ x | V∈ Vj)(EθV[V | V∈ [Vj]- 十). (19) 在所有情况下,混合策略的扩展都很简单。此外,对于所有(纯)策略x∈ 十、 wKLD函数是kabee(X,θ)=EQF(·X)lnQF(A,^V|x)QABEEθ(A,^V|x)=kXj=1X(a,v)∈A×Vjp(A,v)lnp(A,v)θj(A)θv(v)。每x∈ 十、 θ(X)=(θ(X)。。。,θk(x),θV(x))∈ ΘA=×j(A) ×(五) 式中θj(x)(a)=pA | Vj(a | V∈ Vj)A.∈ A和θV(x)=pv是使KABEE(x,·)最小化的唯一参数值。与(19)一起,我们得到了正文中的方程∏Abe。行为平衡(天真版)与类比类。当然,也可以考虑文献中未探讨的情况,即反馈是局部的,主观模型由Θa参数化。假设买方的行为稳定到某个价格x*.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:02:01
由于类比类别之间可能存在相关性,买方现在可能认为偏离不同的价格x 6=x*影响她的价值。尤其是,买家可能对x有多种信念*. 为了获得自然均衡,我们假设买方也观察包含其已实现估值的模拟类,无论其是否交易,以及Pr(V∈Vj,A≤ x) 对于所有j=1,…,大于0。。。,k和x∈ 我们用函数fP表示这个新的反馈假设*: X×A×V→ Y*Y在哪里*= A×V∪ {1,…,k}和fP*(x,a,v)=(a,v)如果a≤ x和fP*(x,a,v)=(a,j)如果a>x和v∈ Vj。给定这个反馈函数的目标分布是,十、∈ 十、(a、v)∈ A×V,QP*(a,v|x)=p(a,v)1{x≥a} (十)以及,十、∈ 十、A.∈ A和所有j=1。。。,k、 QP*(a,j | x)=pA | Vj(a | V)∈ Vj)pV(Vj)1{x<a}(x)。主观模型是,十、∈ 十、(a、v)∈A×Vjand all j=1。。。,k、 QBEAθ(a,v | x)=θj(a)θv(v)1{x≥a} (十)以及,十、∈ 十、(a、v)∈ A×Vjand all j=1。。。,k、 QBEAθ(a,j | x)=θj(a)Pv∈VjθV(V){x<a}(x),其中θ=(θ,θ,…,θk,θV)∈ ΘA.特别是,从(17)中,可以看出x的预期收益∈ X如等式(19)所示。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:02:04
此外,对于所有(纯)策略x∈ 十、 另一种更自然的方法是,我们可以要求均衡是一系列混合策略均衡的极限,所有价格都是以正概率选择的。函数isKBEA(x,θ)=EQP*(·| x)lnQP*(A,^V|x)QBEAθ(A,^V|x)=kXj=1X{(a,v)∈A×Vj:A≤x} p(a,v)lnp(a,v)θj(a)θv(v)+x{(a,j)∈A×{1,…,k}:A>x}pA|Vj(A|V∈ Vj)pV(Vj)lnpA | Vj(a | V∈ Vj)pV(Vj)θj(a)pV∈VjθV(V)。每x∈ 十、 θ(X)=(θ(X)。。。,θk(x),θV(x))∈ ΘA=×j(A) ×(五) 式中θj(x)(a)=pA | Vj(a | V∈ Vj)A.∈ A和θV(x)(V)=pV | A(V | V∈ Vj,A≤ x) pV(Vj)五、∈ Vj,所有j=1。。。,k是使KBEA(x,·)最小的唯一参数值。与(19)一起,我们得到了∏BEA(x,x)*) =Pki=jPr(V∈ Vj)公共关系(A)≤ x | V∈Vj)EV | V∈ Vj,A≤ 十、*- 十、.B逆结果的证明:定理3Let(¨ui)i∈Ibe是一个支持σ作为平衡的信念文件。考虑以下政策文件φ=(φit)i,t:∈ I和所有t,(uI,si,ξI)7→ φit(ui,si,ξi)≡如果最大∈I||||||||||||I-“气”ui|≤2Cεtаi(ui,si,ξi)否则,其中аi是ψi,C中的任意选择≡ 马克西#Yi×supXi×Yi |πi(xi,Yi)|<∞, 斜纹的顺序(εt)定义如下。尽管我∈ 一、 Fix任何先前的uI,即uI(·| I(σ))=uI(其中对于任何 ΘBorel,u(·| A)是给定的条件概率A)。我们现在证明,如果εt≥ 0利姆特和利姆特→∞εt=0,那么φ是渐近最优的。在整个论证过程中,我们定义了一个任意的i∈ I.滥用符号,letUi(uI,si,ξI,xi)=E|QuI(·si,xi)[πI(xi,Yi)]+ξI(xi)。必须显示ui(ui,si,ξi,φIt(ui,si,ξi))≥ Ui(ui,si,ξi,xi)- εt(20)表示所有(i,t)、所有(ui,si,ξi)和所有xi。通过φ的构造,方程(20)满足最大值∈I||||||||||||I-“Qi”ui||>2Cεt。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-7 03:02:07
如果取而代之的是maxi∈I||||||||||||I-“气”ui|≤2Cεt,thenUi(\'ui,si,ξi,φit(ui,si,ξi))=Ui(\'ui,si,ξi,νi(\'ui,si,ξi))≥ Ui(°i,si,ξi,xi),(21)xi∈ xi此外xiUi(ui,si,ξi,xi)- Ui(ui,si,ξi,xi)=Xyi∈Yiπ(xi,Yi)“气”ui(一思,十一)-“七u一(一|四,十一)≤ supXi×Yi |πi(xi,Yi)|Xyi∈易“气”ui(一思,十一)-“七u一(一|四,十一)≤ supXi×Yi |πi(xi,Yi)|×#Yi×maxi,xi,si“气”ui(一思,十一)-“七u一(一|四,十一)所以通过我们选择C,|Ui(ui,si,ξi,xi)- Ui(ui,si,ξi,xi)|≤ 0.5εtxi因此,等式(21)暗示等式(20);因此,如果εt≥ 0t和Limt→∞εt=0。我们现在构造一个序列(εt)tsuch,εt≥ 0利姆特和利姆特→∞εt=0。设φi=(φit)tbe,使得φit(ui,·,·)=φi(ui,·,·)ui;i、 e.“φi”是一种静态策略,在假设信念总是“ui”的情况下使效用最大化。设ζi(ui)≡2C|||||||||||||-“Qi”ui | | |并假设(证明在末尾)pu,φ(limt→∞马克西∈I|ζI(uit(h))|=0)=1(22)(请记住,Pu,\'φ是由政策文件φ诱导的h上的概率度量;φ,Pu,\'φ的定义不依赖于μ)。然后通过第二个Borel-Cantelli引理(Billingsley(1995),第59-60页),对于任何γ>0,PtPu,\'-φ(maxi∈I|ζI(uit(h))|≥ γ) <∞. 因此,对于任何a>0,都存在一个序列(τ(j))jsuch thatXt≥τ(j)Pu,\'φ马克西∈I|ζI(uit(h))|≥ 1/j<A.-j(23)和limj→∞τ(j)=∞. 尽管如此,t≤ τ(1),我们设置εt=3C,对于任何t>τ(1),我们设置εt≡ 1/N(t),其中N(t)≡P∞j=11{τ(j)≤ t} 。注意,自从limj→∞τ(j)=∞,N(t)→ ∞ 作为t→ ∞ 因此εt→ 0
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群