全部版块 我的主页
论坛 经济学人 二区 外文文献专区
2022-6-14 16:07:57
实际上,取增长速度比√N(例如,MN=对数N)。然后,当级联发生时,只有不到MNplayers显示了他们的信息。这意味着在级联发生之前(对于大N),已经发现了关于V的极少量可用信息。这对社区来说确实是一个灾难性的结果(当级联操作与产品质量不一致时)。B、 在δ=1或足够大δ<1的情况下,在本小节中,我们研究固定N和δ=1或足够大δ<1的信息级联。我们将这些病例分别称为完全有耐心和充分有耐心的参与者。如图所示,在此设置中会出现非常令人惊讶的结果。δ=1的解决方案将完全避免V=-1和足够高的δ<1的解决方案将避免V=-1(所谓“有害”是指不良的信息级联,在级联时,整个私有信息中只有一小部分在网络中传播)。我们首先研究δ=1且足够大δ<1的FPE 3的解决方案。定理7。以下策略文件是FPE 3的解决方案,o对于δ=1,γ*= φ[r,y,w]=0,y≤ -2I,y≥ -1,w<N1,y≥ 1,w=N,r=1I,y∈ {0, -1} ,w=N,r=1(35a)o对于足够大的δ<1(取决于N和游戏的其他参数),γ*= φ[r,y,w]=0,y≤ -2I,y≥ -1,y+w<NI,y=1,w=N- 1,r=0I,y=0,w=N,r=11,y≥ 2,y+w≥ N1,y=1,w≥ N- 1,r=1(35b)2020年3月10日绘图证明:见附录I定理7中给出的策略文件分别在图2和图3中描述了N=11和δ=1以及大值δ<1。注意,策略γ*= I(用01表示)扩展到所有状态≥ -δ=1时,w<N。图2:。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 16:08:00
N=11和δ=1的平衡策略。“00”、“01”和“11”分别表示策略0、I和1。图3:。N=11且δ<1足够大的平衡策略。“00”、“01”和“11”分别表示策略0、I和1。利用定理7,我们接下来论证了V=-1和δ=1。回想一下,当玩家有私人信号,但不根据他们的信号行事时,即他们玩γ时,就会发生信息级联*= φ[0,y,w]=1或γ*= φ【0,y,w】=0。请注意,这一定义基于尚未披露的参与者的策略,即r=0,而不是r=1。2020年3月10日,当V=1和γ时,出现了错误的信息级联*= φ[0,y,w]=0或V=-1和γ*= φ【0,y,w】=1。这两种情况是应该避免的。此外,在研究信息级联时,我们应该考虑层的数量w,当发生不良信息级联时,这些层已经暴露出来,因为这个数字显示了系统中已经传播的信息量。在不良信息层叠时已经透露的玩家数量越多,这种现象的危害就越小。接下来的两个定理形式化了我们的结果。定理8。对于δ=1,存在一个sPBE,在v=-1、证明:考虑定理7中δ=1的策略证明(如图2所示)。没有策略γ*=φ[r=0,y,w]=1。这意味着对于V=-1、此战略文件不会出现不好的信息级联。尽管定理8指出,对于V=-1,由于策略γ,它们总是在V=1时以正概率发生*= φ[r=0,y,w]=0,为y播放≤ -2和所有w.定理9。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 16:08:08
对于足够大的δ<1,存在一个sPBE,V=-1只有当至少一半的玩家透露了他们的私人信息时,才会发生这种情况。证明:假设δ<1足够大,以至于定理7第二部分(如图3所示)的策略文件是sPBE。该战略文件包括战略γ*= φ[0,y,w]=1表示y≥ 2安迪+w≥ N(图3中的黄色单元格)。这意味着V=-1、只有在≥ 2和y+w≥ N、 这反过来意味着,当至少w=N时,会发生错误的信息级联。因为y的初始值为0,并且在达到其中一个状态之前使用的策略是y≥ 2和y+w≥ N、 都是γ*= φ[r,y,w]=I,w的值等于已经透露的玩家数量。因此,只有当至少一半的玩家透露了他们的私人信息时,才会发生不良级联。在这一点上,我们注意到,定理9中δ<1的值取决于博弈的参数,如N。这种依赖性在定理7的证明中明确显示出来。根据定理9,至少有一半的玩家在级联时透露了他们的信息。然而,请注意,δ的值可能接近1,asN接近于1。八、数值结果在本节中,我们给出了FPE 3解的数值结果。结果如下。首先,使用迭代算法来求解FPE,这与马尔可夫决策过程求解中使用的值迭代算法非常相似。迭代过程一直运行到值函数数值收敛。为了毫无疑问地验证该解决方案是平衡的,接下来进行了第二步。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 16:08:12
第二步,确定通过该迭代过程获得的平衡策略,并用所有值函数表示未知量的线性方程组。使用有限精度算法(通过rationalMarch 10,2020 DRAFTnumber表示)求解该系统,并获得与该策略文件相对应的精确值函数。最后一步是检查获得的值函数是否满足顺序合理性,即是否满足(26)中的所有不等式。下面我们给出了N=11、p=0.1和δ的三个不同值的结果,即δ=0、δ=0.999和δ=1。第一种情况(δ=0)本质上是近视球员的情况,图4中的结果证实了[2]中的结果。无论w值多少,尚未透露信息的玩家总是会选择y≤ -2、始终为y购买≥ 2并透露他们的信息-1.≤ y≤ 请注意,对于y=1,一个非暴露玩家在γ=I和γ=1之间是不相关的,对于y=-1、我们通过假设球员总是透露信息来解决平局。此外,对于y=0,一个已经透露的玩家在任何动作之间都是无关紧要的,我们通过假设她总是透露来解决这个模糊性。图4:。N=11,p=0.1,δ=0的平衡策略。“00”、“01”和“11”分别表示策略0、I和1。第二个案例(δ=0.999)研究了更多的患者参与者,结果如图5所示。毫不奇怪,玩家在做出购买决定之前愿意等待更多。事实上,对于w=2到w=5的值,并且相信产品质量为y=2,玩家不会承诺购买(即玩γ=1),但平衡策略是揭示她的信息(γ=i)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 16:08:15
类似地,对于相信的产品质量y=2的玩家,已经透露了她的私人信息Xn=-1选择等待(γ=0)。第三个案例(δ=1)针对具体患者参与者进行研究,结果如图6所示。直觉表明,玩家在做出购买决定之前愿意等待更多时间。事实上,对于w=5,并且当可信产品质量为y=5时,玩家没有承诺购买(即玩γ=1),但均衡策略是披露她的信息(γ=i)。类似地,对于w=6且相信产品质量为y=4的玩家,其已披露其私人信息Xn=-1选择等待(γ=0)。很明显,随着w的增加和我们接近游戏的尾声,玩家变得更具攻击性,因为等待学习的信息越来越少,在w=N时,δ=0和δ=1的均衡策略是一致的。然而,就patientMarch 10而言,2020年绘图。N=11,p=0.1,δ=0.999的平衡策略。“00”、“01”和“11”分别表示策略0、I和1。玩家之间出现了一种更具合作性的平衡(参见图6中红三角所示的策略),玩家愿意通过透露自己的私人信息来帮助对方学习未知状态V。我们注意到,这些结果与定理7并不矛盾,因为该定理声称FPE存在特定解,但不存在唯一性。事实上,虽然这是δ=1的情况,但我们的数值算法收敛到(35b)中描述的平衡,也如图3所示。图6:。N=11,p=0.1,δ=1的平衡策略。“00”、“01”和“11”分别表示策略0、I和1。下一组图表显示了信息质量的影响。图7描绘了δ=0.999和p=0.4的情况下的平衡。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 16:08:18
这是一个比英菲格描述的更吵闹的私人观察。因此,均衡行为变得“更为温和”:玩家愿意等待更多时间并披露他们的信息,2020年3月10日,因为现在单个观察的质量比以前低。图7:。N=11,p=0.4,δ=0.999的平衡策略。“00”、“01”和“11”分别表示策略0、I和1。与之前的结果相比,最后一个图显示了两个不同V值、不同p值和更多用户N=21的不良级联概率。我们进一步根据级联发生时W的值对该概率进行分解。我们将此信息描述为累积的badcascade概率,其中W≤ w代表w∈ 图8中的{0,…,N}。从该图中可以明显看出,对于V=1和V=-当V=1时,情况更为严重,也就是说,当产品很好而玩家选择不购买时。这是由于平衡为γ=0的(y,w)值集与平衡为γ=1的(y,w)值集的不对称性造成的。九、 结论我们研究了非近视玩家的贝叶斯学习情景。我们的模型概括了最早报告信息级联的经典近视和顺序一次性场景。为了分析该场景中的信息级联,需要对动态游戏的PBE进行复杂的分析。通过引入结构化战略(structuredstrategies),我们构建了涉及有限域上定义的价值函数的FPE。通过进一步利用模型的结构,我们构建了具有值函数的FPE,这些值函数的大小仅在参与者数量N中呈二次增长,并且具有直观的解释。基于这些方程的可处理性,Wein研究了它们在两种情况下的解。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 16:08:21
第一个是固定δ<1且渐近大N。第二个是固定N和δ=1或渐近接近1。对于第一种情况,我们证明了informationalcascade最终发生的概率接近1。在这些信息级联中,只有一小部分信息被揭示出来,大N的可能性很高,这使得这些级联是无效的,并且是真正的病理结果。对于第二个政权,出现了一个非常令人惊讶的结果。当产品不好时,耐心的玩家可以完全避免不好的级联。此外,对于有足够耐心的玩家,当出现不良级联(针对不良产品)时,至少一半的玩家已经透露了他们的私人信息,即2020年3月10日DRAFTFig。8、N=21的不良级联概率,δ=0.999999,p∈ {0.1, 0.2, 0.3, 0.4}.这意味着这种行为不是病理结果。已开发FPE的数值解表明,玩家表现出的非近视行为比我们推广的近视情况要复杂得多。定理1的附录A假设:让我们假设除玩家n以外的所有玩家都按照γ进行游戏*t=θ[nt,πt,bt],即antt=γ*t(xnt)=θ[nt,πt,bt](xnt),对于所有的nt6=n。让我们进一步假设信念π的更新固定为πt+1=F(πt,γ*t、 antt,nt)=F(πt,θ[nt,πt,bt],antt,nt)=:Fθ(πt,nt,antt,bt)。我们将证明游戏者n所面临的优化问题可以表述为一个马尔可夫决策过程(MDP)。为此,我们将动态系统的状态、行为和瞬时回报定义如下。系统状态定义为asst=(xn,nt,πt,bt)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 16:08:25
此外,动作空间根据方程式(7)定义,其中在每次t时,玩家都会接受动作蚂蚁∈ An(bnt,nt)并收到即时奖励R(st,ant)=antPvvπpr(v | xn)。我们首先证明了(st)是一个具有动作ant的受控马尔可夫过程,即P(st+1 | s1:t,an1:t)=P(st+1 | st,ant)。(36)事实上,P(st+1 | s1:t,an1:t)=P(\'xn,nt+1,πt+1,bt+1 | xn,n1:t,π1:t,b1:t,an1:t)(37a)=1xn(\'xn)NQb(bt+1 | xn,nt,πt,bt,ant)Qπ(πt+1 | xn,nt,πt,bt,ant),(37b)2020年3月10日通过qb(bt+1 | xn,nt,πt,bt,ant)=Qbn(bnt+1 | bnt,ant)NYm=1,m6=NQb定义-n(bmt+1 | xn,nt,πt,bt)(38a),带qbn(bnt+1=1 | bnt,ant)=1,bnt=1,或ant=10,否则(38b)Qb-n(bmt+1=1 | xn,nt,πt,bt)=m(nt)Pxmπpr(xm | xn)1θ[nt,πt,bt](xm)(1),bmt=01,bmt=1(38c)和qπ(πt+1 | xn,nt,πt,bt,ant)=Pxntπpr(xnt | xn)1Fθ(πt,nt,θ[nt,πt,bt](xnt,bt)(πt+1),nt6=nFθ(πt,nt,ant,bt)(πt+1),nt=n.(38d)正是上述等式揭示了为什么必须固定信念更新才能证明玩家面临MDP。如果情况并非如此,则上述方程将要求通过πt+1=F(πt,γt,antt,nt)形式的表达式更新信念,这将要求在nt=n的情况下,将部分函数γt包含在动作空间中,而不是仅包含动作ant。我们现在已经证明了(36)。因此,状态过程(st)与奖励R(st,ant)形成了一个有限的水平MDP,因此可以从以下状态的FPE中得出最佳纯策略s=(xn,na,π,b),a*n=γ*(xn)=arg maxan∈An(bn,na)(anXvvπpr(v | xn)+δE[Vn(xn,na,π,B)| xn,na,π,B,An],(39a),其中na,π和B是下一状态元素的随机变量,期望值根据过渡核(38)。此外,Vn(xn,na,π,b)=maxan∈An(bn,na)(anXvvπ(v | xn)+δE[Vn(xn,na,π,B)| xn,na,π,B,An])。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 16:08:28
(39b)接下来,我们需要证明上述FPE等同于FPE 1。我们首先表明Vn(xn,na,π,bn=1,b-n) =0对于所有xn,n,π,b-n、 根据(7)中定义的动作空间,如果bn=1,An(bn,na)={0}。这意味着该状态下的即时奖励为0。另一方面,根据(38)中b的过渡核,该状态以bn为单位吸收,这意味着对于所有未来状态,bn也为1。这将导致玩家n在所有即将到来的状态中获得0奖励,因此Vn(xn,na,π,bn=1,b-n) =0。上述情况意味着playern面临着停车时间问题。如果n是代理玩家(n=na),FPE(39)实际上是在购买和获得即时回报PVVπpr(v | xn)或等待和获得δE[Vn(xn,na,π,B)| xn,na,π,B,an]之间进行选择。根据转换核(38),δE[Vn(xn,Na,π,B)| xn,Na,π,B,an]=δNPNna=1Vn(xn,Na,F(π,γ*, 0,n),b)。因此,对于n=na,FPE(39)相当于(15a),前三种情况(15c)。此外,如果n不是扮演者(n 6=na),因为An(bn,na)={0},Vn(xn,na,π,b)=δE[Vn(xn,na,π,b)| xn,na,π,b,An]。2020年3月10日根据过渡核(38),δE[Vn(xn,Na,π,B)| xn,Na,π,B,an]=δNNXna=1EVn(xn,na,π,Bnab-na)| xn,na,π,b,an.从(38)中可以明显看出∏=F(π,γ*, γ*(Xna),na)a.s.,因此,Vn(xn,na,π,b)=δNNXna=1E{Vn(xn,na,F(π,γ*, γ*(Xna),na),Bnab-na)| xn,na,π,b,an},这是(15c)的第四种情况。证明的结论是,Bnain(38b)的转移核与(15d)的转移核相同。现在,通过(16)中的正向算法递归地跟踪每个信息集来构造sPBE是一项简单的任务(我们还使用了私有变量X。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 16:08:36
,XNare独立于V,这一事实将在引理2中得到确凿的证明)。附录B引理2的证明:我们用归纳法证明了这个引理。对于t=0,我们有π(x,v)=Ps(x,v | n)=Q(v)QNm=1Q(xm | v)。假设πt-1(x,v)=πt-1(v)QNm=1πt-1(xm | v)我们有πt(x,v)=Ps(x,v | a0:t-1,n0:t)(40a)=Ps(x,v,at-1,nt | a0:t-2,编号:t-1) Ps(在-1,nt | a0:t-2,编号:t-1) (40b)=(1/N)Ps(在-1 | x,v,a0:t-2,编号:t-1) Ps(x,v | a0:t-2,编号:t-1) Ps(在-1,nt | a0:t-2,编号:t-1) (40c)=(1/N)QNm=1γmt-1(xm)(金额-1)πt(x,v)Px,v(1/N)QNm=1γmt-1(xm)(金额-1)πt(x,v)(40d)=QNm=1γmt-1(xm)(金额-1)πt-1(v)QNm=1πt-1(xm | v)Px,vQNm=1γmt-1(xm)(金额-1)πt-1(v)QNm=1πt-1(xm | v)(40e)=QNm=1γmt-1(xm)(金额-1) πt-1(xm | v)πt-1(v)PvQNm=1Pxmγmt-1(xm)(金额-1) πt-1(xm | v)πt-1(v)。(40f)给定V和hctcan的X的条件分布现在可以写成πt(X | V)=QNm=1γmt-1(xm)(金额-1) πt-1(xm | v)PxQNm=1γmt-1(xm)(金额-1) πt-1(xm | v)(41a)=NYm=1γmt-1(xm)(金额-1) πt-1(xm | v)Pxmγmt-1(xm)(金额-1) πt-1(xm | v)(41b)=NYm=1πt(xm | v),(41c)2020年3月10日,完成归纳步骤,证明私有信息变量X,XNare conditionallyindependent给定v,hct,从而证明(17)。此外,(41c)提供了条件概率f的更新方程,即πt(xm | v)=γmt-1(xm)(金额-1) πt-1(xm | v)Pxmγmt-1(xm)(金额-1) πt-1(xm | v)(42a)=πt-1(xm | v),m 6=nt-1或γmt-16=Ixm+1(金额-1) ,m=nt-1和γmt-1=I.(42b)因此,如果玩家m在时间t之前尚未透露其信息,则πt(xm | v)=···=π(xm | v)=Q(xm | v)。或者,如果玩家m在时间t之前的某个时间点透露了她的信息,我们得到πt(xm | v)=xm(xm),从而证明(18)。现在,边缘化(40a)w.r.t。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 16:08:40
我们有πt+1(1)πt+1(-1) =QNm=1Pxmγmt(xm)(amt)πt(xm | 1)QNm=1Pxmγmt(xm)(amt)πt(xm |- 1) πt(1)πt(-1) (43a)=Pxntγt(xnt)(antt)πt(xnt | 1)Pxntγt(xnt)(antt)πt(xnt |- 1) πt(1)πt(-1) ,(43b)其中,最后一个等式是由于所有非演艺演员的γmt=0。此外,如果γt6=Ior,则主动参与者已经透露了她的信息,乘法因子将减少到1。否则,系数becomespxntxnt+1(antt)Q(xnt | 1)Pxntxnt+1(antt)Q(xnt |- 1) =Q(2antt- 1 | 1)Q(2antt- 1| -1) =q2antt-1,(43c)从而证明(19)。最后,假设Q(1)=Q,通过重复替换上述方程得到(20(-1) =1/2,为简单起见。附录C通过问题对称性的多项式维F计算PBE,我们确定集合K={00,-10, 01, -11,+11}其中,该集合的元素都是该对▄xibican为每个玩家i取的可能值。请注意,+10在任何策略下都不会发生,因此它不包括在集合中。因此,根据球员的身高和身高,他们被分为5组。我们确定了节理类型(按比例的经验分布),txbof序列(x,b)astxb(k)=NXi=1xibi(k),k∈ K、 (44)对于每种类型的t,t(K)≥ 0和PK∈Kt(k)=N,所以N+4~ n选择可能的类型。注意,根据上述定义,聚合状态信息y=PNi=1xi等于y=t(+11)-t型(-10)-t型(-11).我们定义了以下函数Ua:X×K×T→ R、 尺骨:X×K×T→ R代表所有l∈ K、 这些功能的含义如下。Ua(x,k,t)表示演技演员n的值函数,其私有信息xn=x,她的一对xnbn=k(因此她属于k组)和序列的关节类型(~x,b)为2020年3月10日DRAFTt。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 16:08:44
类似地,尺骨(x,k,t)表示非代理玩家m的值函数,其私人信息xm=x,她的配对xmbm=l(因此她属于组l),代理玩家n的配对xnbn=k(即属于组k),序列的关节类型(▄x,b)为t。最后,我们定义了更新函数gx,gb和gtas,如下gx(kx,γ,a)=2a级- 1,如果kx=0,γ=Ikx,则为,(45a)gb(kb,a)=a,如果kb=0kb,则为(45b)gt(k,t,γ,a)(k)=t(k)- 1,如果k=k和gxb(k,γ,a)6=kt(k)+1,如果k=gxb(k,γ,a)和gxb(k,γ,a)6=kt(k),否则(45c),其中我们使用符号k=kxkb分解k指数的两部分,并且我们还使用符号gefg表示(ge,gf,gg)任何e,f,g∈ {x,b,t}。我们在FPE 4中考虑以下FP方程。不动点方程4(多项式维数)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 16:08:47
每k=kxkb∈ K、 t型∈ T我们评估γ*= φ[k,t]如下所示:如果kb=1,则γ*= 0.o如果kb=0,则γ*是以下方程组γ的解*(x) =arg max{A |{z}0=不购买,qy+x1(kx)- 1qy+x1(kx)+1 |{z}1=购买}x个∈ 十、 (46a)式中=δNUa(X,gxbt(k,t,γ*, 0))+δNXk∈K[t(K)- 1k(k)]Ugxb(k,γ*,0)na(x,k,gt(k,t,γ*, 0))](46b),其中值函数满足a(x,k,t)=0,如果kb=1A,如果kb=0,γ*(x) =0qy+x1(kx)-1qy+x1(kx)+1,如果kb=0,γ*(x) =1,(46c),对于所有l=lxlb∈ 库尔纳(x,k,t)=0,如果lb=1,δNE[Ua(x,l,gt(k,t,γ*, γ*(Xn))]+δNE[尺骨(x,gxbt(k,t,γ*, γ*(Xn))]+δNXk∈K[t(K)- 1k(k)- 1l(k)]E[尺骨(x,k,gt(k,t,γ*, γ*(Xn)))],如果lb=0,,(46d)2020年3月10日绘图,其中最后一个等式中的期望值为wrt RV xnwhere(Xn=Xn | l,x,k,t)=kx(xn),如果kx6=0Q(xn|-1) +Q(xn | 1)qy+x1(lx)qy+x1(lx)+1,否则。(46e)现在我们将证明,如果最后一个FP方程有一个解U*, 那么原始FP方程有一个解V*其中V*可以很容易地从U*.给定解决方案U*在上述FP方程(连同策略φ)中,我们构建了以下策略和价值函数。γ*= θ[n,~x,b]=φ[~xnbn,t ~x,b](47a)~Vm(·,n,~x,b)=Ua(·,~xnbn,tx,b),如果m=nUxBMNA(·,~xnbn,tx,b),如果m 6=n.(47b),我们将证明这些值函数是原始FPE 2的解。定理10。值函数(¢Vm)m∈Ntogether与策略映射γ*= φ[·]满足FPE 2。证明:修复导致t类型具有累积状态y的n、~x和b。活动播放器n属于组k=kxkb=~xnbn。如果bn=1,则kb=1和γ*= 如果bn=0,则(21a)中的第二项显然为平方Y+xn(kx)-1qy+xn(kx)+1,与(46b)中的第二项完全相同(xn=x)。考虑(21a)中的格式。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 16:08:50
主动参与方n的新组为^k=f(¢xn,γ*, 0)0=gxb(k,γ*, 0)且总类型的新值将更改为^t=gt(k,t,γ*, 0). 上述含义是,(21a)中的第一项将beNXn=1Vn(xn,n,x-nf(¢xn,γ*, 0),b-n0)=▄Vn(xn,n,▄x-nf(¢xn,γ*, 0),b-n0)+NXn=1,n6=nVn(xn,n,x-nf(¢xn,γ*, 0),b-n0)=Ua(xn,^k,^t)+NXn=1,n6=nU^kna(xn,^nbn,^t)=Ua(xn,^k,^t)+Xk∈KNXn=1,n6=n,~xnbn=kU^kna(xn,~xnbn,^t)=Ua(xn,gxbt(k,t,γ*, 0))+Xk∈K[t(K)- 1k(k)]Ugxb(k,γ*,0)na(xn,k,gt(k,t,γ*, 0)),(48),其中t(k)项- 1k(k)枚举向量▄x中的所有参与者n6=n-nf(¢xn,γ*, 0),b-n0,由原始类型t从活跃玩家组中减去一得到。这正是(46b)中的表达式,因此(21a)满足。现在考虑(21b)。固定m并用l=lxlb=~xmbm表示第m个玩家的组。该方程的前三个分支显然是令人满意的。关于第四个分支,我们知道2020年3月10日活跃玩家的新组别DRAFTn将为^K=f(~xn,γ*, γ*(Xn)),B0n=gb(kb,γ*(Xn)),新类型为^T=gt(k,T,γ*, γ*(Xn))。(21b)的左手侧变成尺骨(xm,k,t),lb=0。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 16:08:54
右侧变为1E虚拟机xm,n,x-nf(¢xn,γ*, γ*(Xn)),b-nB0n= E虚拟机xm,m,~x-nf(¢xn,γ*, γ*(Xn)),b-nB0n+ E虚拟机xm,n,x-nf(¢xn,γ*, γ*(Xn)),b-nB0n+NXn=1,n6=m,nE虚拟机xm,n,x-nf(¢xn,γ*, γ*(Xn)),b-nB0n= E[尺骨(xm,l,^T)]+E[尺骨(xm,^K,^T)]+Xk∈KNXn=1,n6=n,m,~xnbn=kE[尺骨(xm,~xnbn,^T)]=E[Ua(xm,l,gt(k,T,γ*, γ*(Xn))]+E[尺骨(xm,gxbt(k,t,γ*, γ*(Xn))]+Xk∈K[t(K)- 1k(k)- 1l(k)]E[尺骨(xm,k,gt(k,t,γ*, γ*(Xn)))]。(49)这正是(46d)中的表达式,因此(21b)是令人满意的。我们在这一点上指出,该方法可以推广到δ值不同的异质参与者。所需要的只是考虑向量x,b,δ的关节类型。FP方程的相应维数为~ N4Kδ,其中Kδ是不同类型δ的数量。附录D定理3Proof:修正n,~x,得到总体参数y和w。主动玩家要么没有透露信息(~xn=0),要么透露了错误信号(~xn=-1) ,否则她早就买了产品,退出了游戏。这意味着xn=-r、 很明显,(21a)中的第一项变成了sqy+r+xn-1qy+r+xn+1,与(26a)中的第一项完全相同(xn=x)。考虑(21a)中的第二项。主动播放器n的新参数为^r=| f(≈xn,γ*, 0)|=Gr(r,γ*) 人口参数的新值为(^y,^w)=Gyw(r,y,w,γ*, 0).
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 16:08:57
上述含义是,(21a)中的第二项(除了δ/N因子)NXn=1Vnxn,n,~x-nf(¢xn,γ*, 0),b-n(50a)=Vnxn,n,~x-nf(¢xn,γ*, 0),b-n+NXn=1,n6=nVnxn,n,~x-nf(¢xn,γ*, 0),b-n(50b)=Ua(xn,^r,^y,^w)+NXn=1,n6=nU^rnaxn,zn,^y,^w(50c)=Ua(xn,^r,^y,^w)+NXn=1,n6=n,zn=0U^rna(xn,0,^y,^w)+NXn=1,n6=n,zn=1U^rna(xn,1,^y,^w)(50d)=Ua(xn,^r,^y,^w)+(n- w-1+r)U^rna(xn,0,^y,^w)+(w- r) U^rna(xn,1,^y,^w)2020年3月10日草案=Ua(xn,Gryw(r,y,w,γ*, 0))+(N-w- 1+r)UGr(r,γ*)na(xn,0,Gyw(r,y,w,γ*, 0))+(w- r) UGr(r,γ*)na(xn,1,Gyw(r,y,w,γ*, 0)) . (50e)这正是(26b)中的表达式,因此(21a)满足。现在考虑(21b)。固定m并用▄r=▄xm▄表示第m个播放器的参数。该方程的前三个分支显然是令人满意的。关于第四个分支,我们知道活动层的新参数为^Z=Gz(Z,γ*, γ*(Xn)),新的总体参数为(^Y,^W)=Gyw(z,Y,W,γ*, γ*(Xn))。(21b)的左侧变成Urna(xm,z,y,w)。右侧变为1E虚拟机xm,n,x-nf(¢xn,γ*, γ*(Xn)),b-nB0n= E虚拟机xm,m,~x-nf(¢xn,γ*, γ*(Xn)),b-nB0n+ E虚拟机xm,n,x-nf(¢xn,γ*, γ*(Xn)),b-nB0n+NXn=1,n6=m,nE虚拟机xm,n,x-nf(¢xn,γ*, γ*(Xn)),b-nB0n= E[Ua(xm,r,Y,W)]+E[uRNA(xm,Z,Y,W)]+NXn=1,n6=n,m,zn=1E[uRNA(xm,1,Y,W)]+NXn=1,n6=n,m,zn=0E[uRNA(xm,0,Y,W)]=E[Ua(xm r,Gyw(Z,Y,W,γ*, γ*(Xn))]+E[Urna(xm,Gzyw(z,y,w,γ*, γ*(Xn)))]+(w- z- r)E[U]rna(xm,1,Gyw(z,y,w,γ*, γ*(Xn)))]+(N- w- 2+z+r)E[Urna(xm,0,Gyw(z,y,w,γ*, γ*(Xn)))]。(51)这正是(26d)中的表达式,因此(21b)是满足的。引理3的附录EPROOF首先,我们表明,每当γ*= φ[0,y,w]=0,赋值函数都是0,我们必须有γ*=φ【1,y,w】=0。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 16:09:01
根据FPE 3,在状态(x,r,y,w)下,我们有a=δNUa(x,r,y,w)+δN(N- w- 1+z)Urna(x,0,y,w)+δN(w- z) Urna(x,1,y,w),其中,对于两种情况,Urna(x,z,y,w)=δNUa(x,r,y,w)+δN(N- w- 1+z)Urna(x,0,y,w)+δN(w- z) Urna(x,1,y,w)。自γ以来*= φ[r,y,w]=0,我们应该有Ua(x,r,y,w)=A。因此,我们可以求解上述方程中的Ua(x,r,y,w)、Urna(x,0,y,w)、Urna(x,1,y,w)和A。很容易看出,所有这些量的解都是0,因此A=0。因此,Ua(x,r,y,w)=0,很明显,对于y<-2、玩家严格选择等待,因为即时奖励的期望值为负,他们更喜欢得到A,即0。此外,2020年3月10日表格通风量=-2,r=0或r=1且x=-我更喜欢等待,而r=1和x=1的玩家在购买和不购买之间没有区别(她的即时奖励的预期值为0)。它证明了定理的第三部分。现在考虑δ=1。假设γ*= φ[r,y,w]是FPE 3的解。根据γ*, 定义玩家n\'sterminating状态为玩家n决定购买产品(并退出游戏)或从此不再购买,即玩γ*= 当其他人都是时为0(这意味着玩家实际上离开了游戏)。在游戏的每个状态下,γ*对通过不购买代理玩家的决策而达到的游戏未来终止状态施加概率分布。因此,在每个州,玩家将v的预期值与她未来不购买产品所能获得的预期值进行比较,这是她购买产品的终止州的v值与零之间的平均值,对应于她决定永远不购买产品的终止州。引理5。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 16:09:05
假设根据γ*= φ[r,y,w],我们知道代理玩家将在未来所有终止状态下购买产品(如果代理玩家决定不购买,则发生概率为正的状态),然后她对δ=1的购买和不购买产品漠不关心。否则,她更愿意等待δ=1。证据:根据FPE 3,代理玩家将v的预期值与未来终止状态下v的预期值的平均值进行比较,如果代理玩家决定不购买,则有正概率发生。更正式地说,如果我们用s表示当前状态,如果玩家不用s购买,则未来的终止状态将以正概率发生。。。,sk,那么我们有γ*(x) =参数最大值kXj=1E[v | sj]p(sj | s),E[v | s](52)根据总期望定律,我们知道上述条件总是相等的,无论状态如何。。。以及它们发生的概率。唯一的要求是在所有州。。。sk玩家决定购买产品。因此,如果玩家发现自己处于可能导致终止状态的状态。。。sk(通过不购买),她将决定购买所有产品(根据γ*), 事实上,在δ=1的当前状态下,她对购买和不购买漠不关心。接下来,假设在一个终止状态s处。。。sk,比方说sj,玩家严格不愿意购买产品,她在sj的估值为零,因此,v的预期值应该是负的。因此,通过用零代替等式52中的E[v | sj],我们得到了一个大于E[v | s]的项。这意味着,在当前状态下,不购买的预期价值大于v的预期价值,而当前状态表明,玩家严格倾向于不购买产品。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 16:09:08
如果在一个以上的未来状态中,球员严格不愿意购买,同样的论点也成立。引理6。假设根据γ*, 我们知道,对于状态s,至少存在一个未来终止状态J(如果代理玩家不购买产品,则有正概率发生),在该状态下,代理玩家严格地倾向于不购买产品,然后她严格地倾向于在状态s等待足够大的δ≤ 1、2020年3月10日防风:根据引理5第二部分的证明,对于δ=1,表演选手严格选择等待。因此,存在足够大的δ<1,演戏者仍然严格地倾向于等待。接下来,我们证明定理的前两部分。我们首先描述了w=N的平衡策略。很明显,w=N的平衡是什么,因为所有的状态都在吸收,玩家根据预期的即时奖励行动。对于δ的任何值,我们都有γ*= φ【1,y,N】=0表示y≤ -2, γ*= φ[1,y,N]=Ifor y=-1和γ*= φ【1,y,N】=1表示y≥ 我们也知道γ*= φ[r,y,w]=0表示y≤ -2、为了证明这个定理,我们研究了具有y的对策的所有状态的终止状态≥ -1、自γ起*= 0显示在y=-2,y=-2个正在吸收。因此,没有y<-2可从y的状态访问≥ -因此,所有终止状态都有y≥ -2、另一方面,如果γ*= I在当前状态下,x=1的代理玩家只有在r=1时才能达到终止状态。x=1且r=1的玩家在y=-2并且更愿意在所有州购买y≥ -因此,在玩家喜欢购买的所有终止状态下,根据引理5,她在当前状态下购买和不购买之间没有区别。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 16:09:11
此外,如果γ*= 1在目前的状态下,根据引理5,演艺演员应该对购买和不购买漠不关心(球员应该要么漠不关心,要么严格地选择等待。由于策略γ,后者是不可能的*= 1). 这意味着一个x=1的玩家对于所有有y的州都不在乎买还是不买≥ -1和所有w。这意味着对于δ<1,如果x=1的玩家的即时奖励为正,即y,则他们更愿意购买≥ 0,如果即时奖励为0,即y=-1、接下来考虑x=-1、如果在x=-1我们有y≥ 1或y=0,w=N(她更喜欢购买产品的州),则该玩家应在当前状态下不区分购买和不购买。假设我们有γ*= φ[r,y,w]=每个r,y,w的I(该策略文件向我们展示了每个状态s中最大的可接近终止状态集,尽管它可能不是解决方案)。很明显,对于y+w≥ N和所有r,所有可接近的终止态havey≥ 1或y=0,w=N(在每个状态(r,y,w),玩家可以移动到y- 1和w+1,通过播放γ*= I)。因此,对于δ=1,x=-1对y+w的购买和不购买漠不关心≥ N和所有r。它表示δ<1时,x=-1严格选择y+w购买≥ 如果她的即时奖励为正,即y≥ 2或y=1和r=1,如果她的即时奖励为0,即y=1和r=0或y=0和r=1,则无所谓。定理4的附录F我们通过引理3证明了这个定理。为y提出的战略文件≤ -2是FPE 3的一个明显解决方案,因为r=0的两种类型的玩家都不喜欢购买,因此他们玩γ*= 0
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 16:09:14
这意味着r=1的两种类型的玩家也会玩γ*= 0.对于y≥ -1,一个x=1的玩家是不同的或更喜欢全买δ≤ 因此,她可以决定购买-1.≤ y≤ 此外,我们还可以有γ*= φ[1,y,N]=y=-2,因为x=1的球员打成平局。2020年3月10日x=-1和r=0总是喜欢等待或对-1.≤ y≤ 1(她预期的即时回报要么为负,要么为零),因此她可以决定等待-1.≤ y≤ 对于x=-1和r=1表示-1.≤ y≤ 0。对于y=1,x=-1和r=1具有正的预期即时回报,因此她喜欢等待还是购买取决于δ。因为我们知道,当y=1时,x=1且r=1的玩家的行为是购买,所以y=1且r=1的策略应该是1或I。请注意,此策略不会影响其他州玩家的决策(y>1的州无法达到此策略,y<1的解也不取决于y=1时的策略,正如我们刚刚证明的那样)。因此,可根据FPE 3单独确定。接下来我们必须证明策略γ*= φ[r,y,w]=1是y的解≥ 2和所有w和r。根据引理3,如果策略文件为γ*= φ[r,y,w]=1,对于对策的某些状态s=(x,r,y,w),我们有γ*= φ[r,y,w]=1对于所有w>w(这是该定理中建议的策略文件中的情况),然后在所有可从s到达的终止状态(见引理3的证明),代理玩家购买产品。因此,玩家要么漠不关心(δ=1),要么严格倾向于购买(δ<1),并且完成了策略γ的证明*= φ[r,y,w]=1是y的解≥ 2,所有w、r和所有δ≤ 1.附录G定理5的证明我们首先证明定理的第四部分。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 16:09:18
对于y≤ -2,r=0且x=1和x=-另一方面,根据引理3的证明,当γ*= φ(r,y,w)=0。因此,均衡策略不会同时购买x和soγ的值*= φ(r,y,w)=0是y的唯一解≤ -2、对于y≥ 0时,x=1的瞬时奖励为正,因此,γ*= φ(0,y,w)=0(导致值函数为0)不能是均衡策略。第五部分是显而易见的,因为在y=0时,x=-当x=1时为正。因此,γ*= φ[0,0,w]=0 norγ*= φ[0,0,w]=1可以是FPE 3的解。因此,如果一个解存在,我们知道它存在,我们必须有γ*= φ(0,0,w)=I。现在我们证明第六部分。对于一些平衡策略和一些w和y,γ*= φ[0,y,w]=I或γ*= φ[0,y,w]=1,我们不能有γ*= φ[0,y,w]=0,对于w6=w和y 6=-原因是如果forw6=w,我们有γ*= φ[r,y,w]=0,赋值函数Ua(x,0,y,w)=0,如引理3的证明所证明。另一方面,由于γ*= φ[0,y,w]=I或γ*= φ[0,y,w]=1,我们知道qy+1-1qy+1+1>0,对于y 6=-因此,当r=0,y,wis为正,因此γ时,对x=1的玩家的即时奖励为正*= φ[0,y,w]=0不能是均衡策略。因此,γ*= φ[0,y,w]=I或γ*= φ[0,y,w]=1不能与γ一起发生*= φ【0,y,w】=0,对于相同的y。因此,它是γ*= φ[0,y,w]=0或γ的任一项*= φ[0,y,w]=I或γ*= φ[0,y,w]=1,对于所有的w。第七部分通过使用第四部分和引理3来证明。正如我们在引理3中所看到的,一个x=1的玩家在购买和等待y之间是漠不关心的≥ -1,其中包括y=-这意味着她总是可以决定给你买东西≥ -1.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 16:09:21
另一方面,x=-1有负即时奖励,她不应该在2020年3月10日在y=-因此,由于x=1的玩家的预期奖励为0,因此*= φ[0, -1,w]=I和γ*= φ[0, -1,w]=0可以是所有w的解。我们可以用类似的方式证明第八部分。x=1且r=1的玩家在y=-2,因为即时奖励为0。另一方面,x=-1 andr=1倾向于在y=-2因为她的即时回报是负的,因此*= φ[1, -2,w]=Iandγ*= φ[1, -2,w]=0是解决方案。第三部分是第四部分和第七部分的直接结果。为了证明第一部分,充分证明如果γ*= φ[r,y,w]=I,解是一个阈值策略wrt w,y<y,然后是γ*= φ[r,y,w]=I是w<w的解(注意,它可能不是唯一的情况,我们讨论的是存在性。因此,如果解不是这种类型的,我们可以构造这种类型的解,后面会解释)。假设对于状态s=(x,r,y,w),我们有γ*= φ[r,y,w]=I。这意味着x的瞬时回报=-1在y不超过玩家将购买的终止状态下不购买的预期估值,即奖励的平均值;0在玩家决定不购买产品的终止状态下(见引理3的证明)。不购买决策的最终状态越有可能,不购买的即时回报和预期估值之间的差异就越大。因此,对于具有相同即时奖励的两种不同状态,即相同的y,我们可以比较它们的终止状态,以了解玩家在这两种状态下的决定。当w<w时,考虑s=(r,y,w)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 16:09:25
由于解决方案是y<y的阈值策略w,很明显,对于玩家决定不购买产品的状态s的每个终止状态sj,该状态s有一个对应的状态sj,其发生的可能性至少与sj相同(有更多玩家可以显示其私人信号并改变状态)。在sj,玩家有机会决定不购买该产品,或稍后决定该产品是否对她有利(这意味着sj可能不是s的终止状态)。在这两种情况下,不在sis买入的估值至少与在s买入的估值一样好,因此,如果在s买入的估值不低于即时回报,则对stoo而言必须为真。因此,如果γ*= φ[r,y,w]=I,我们可以得到γ*= φ[r,y,w]=I表示w<w。如果解不是这种类型,我们可以构造如下策略。根据这个定理的其他部分,我们知道解可以是γ*= φ[r,y,w]=0表示y≤ -2,所有r和w,以及γ*= φ[r,y,w]=I,r=0,-1.≤ y≤ 0和所有w,对于r=1,-1.≤ y≤ 0和所有w。因此,无论其他解决方案是什么,我们都可以将其更改为上述战略文件。接下来,我们从y=1开始,我们知道解决方案是y<y的阈值策略。从w=N开始,逐步返回hr=0和r=1,我们可以更改所有解决方案γ*= φ[r,y,w]=1到γ*= φ[r,y,w]=所有w<w的I,因此溶液为γ*= φ[r,y,w]=I。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 16:09:28
通过这种方式,我们构建了一个战略文件,它是FPE 3的阈值策略wrt wand解决方案。现在我们将注意力限制在阈值策略wrt w的均衡策略上,并证明每当γ*= φ[0,y,w]=1,那么我们必须有γ*= φ[0,y,w]=1,对于所有y>y和γ时*= φ[0,y,w]=我们必须有γ*= φ[0,y,w]6=0,对于所有y>y。类似于该定理第六部分证明中的参数,每当γ*= φ[0,y,w]=I,瞬时回报对于x=1是正的,如果我们有γ*= φ【0,y,w】=0,估值将为0,而即时2020年3月10日Yi的DRAFTreward大于y,因此为正值。因此,我们不能有γ*= φ[0,y,w]=0作为解。为了证明当γ*= φ[0,y,w]=1,那么我们必须有γ*= φ[0,y,w]=1对于所有y>y,weassume这不是真的,因此,我们有一个γ*= φ[0,y,w]=1和γ*= φ[0,y+1,w]=I。在这种情况下,x=-1在y+1时,选择不买而不是买,这意味着- 1季度+1≤δNUa(-1,1,y,w+1)+δN(N- w- 1) Una公司(-1,0,y,w+1)+δNwUna(-1,1,y,w+1),(53)自γ起*= φ[0,y,w]=1,我们知道γ*= φ[0,y,w+1]=1,因此,根据定理4的证明,Ua(-1,1,y,w+1)=qy-1qy+1,Una(-1、0、y、w+1)≤qy公司-1qy+1和Una(-1、1、y、w+1)≤qy公司-1qy+1意味着对于δ<1,qy-1qy+1<qy-问题1,这是一个矛盾。接下来考虑r=1。我们首先证明了玩家在s=(x,0,y,w)和=(x,1,y)状态下的决策之间的关系- 1,w+1)。假设γ*= φ【0,y,w】=I。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 16:09:31
就是这个意思-1.- 1季度-1+ 1≤δNUa(-1,1,y- 1,w+1)+δN(N- w- 1) Una公司(-1,0,y- 1,w+1)+δNwUna(-1,1,y- 1,w+1),(54)另一方面,如果我们写x的固定点=-1,r=1,y- 1,w+1,我们有γ*(-1) =参数最大值δNUa(-1,1,y- 1,w+1)+δN(N- w- 1) Una公司(-1,0,y- 1,w+1)+δNwUna(-1,1,y- 1,w+1),qy-1.- 1季度-1+ 1. (55)根据(54),我们可以说上述固定点的解决方案是买不到的。因此,每当γ*=φ[0,y,w]=I,我们可以得到γ*= φ[1,y-1,w+1]=I。同样,根据引理3,当γ*= φ[0,y,w]=1和γ*= φ[0,y,w]=1,对于w>w,我们必须有γ*= φ【1,y,w】=1。这都意味着,每当我们有一个解决方案,即r=0的阈值策略wrt y时,该解决方案也可以是r=1的阈值策略wrt y。附录H定理6的证明如果Yt在所有t>t的概率为1的情况下保持不变,那么这是定义的信息级联,因为Yt汇总了所有披露的私人信息。因此,“yi”的吸收态是信息级联。我们已经证明了一些“Yi=yL”≥ Yminand?Yi=年≤ Ymaxare吸收。yL和yr的值均与N无关。\'Yiarep+(1)的跃迁概率-p) qyqy+1用于向右移动和1-p+pqyqy+1向左移动,因此它们也与N无关。我们得出结论,吸收时间的分布(特别是预期和方差)与N无关。因此,对于足够大的N,吸收时间大于mn的概率为零。该吸收时间计算在恢复i的数量中。我们得出结论,在恢复mn之前发生级联的概率接近1,即N→ ∞.2020年3月10日DRAFTNow假设φ[r,y,w]=1意味着φ[r,y,^w]=1表示^w>w。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 16:09:35
表示轮到MN的次数,其中表演选手N的rnt=1或bnt=1乘以R(MN),R(MN)由p=MN和MNtrials sinceP(Yt+1=Yt | wt)=wtN的一个随机分布变量控制≤MNN。(56)因此,我们从[33,定理A.1.11]得到,对于所有N>0PR(MN)≤MNN公司+√≤ e-NMN公司+√NMN。(57)因此,我们得出结论,在高概率情况下,至少MN- 第一轮中有2人是zn=0的球员。假设依次t<MN- 2该演员没有透露自己的私人信息。o如果她等待,那么wt+1=wt和yt+1=yt。zn=0的下一个玩家也将等待,因为她使用相同的策略γ*= φ[r,y,w]。o如果她买了,那么wt+1=wt+1和yt+1=yt。zn=0的下一个表演玩家也将购买forxn=-1,1(且不显示),因为wt+1>wt。相同的论点适用于所有后续zn=0的玩家,并且从定义到zn=1的玩家,因此发生级联。定理7的附录I根据引理3,y的解是显而易见的≤ -2,对于δ=1和δ<1。根据引理3的证明,我们也知道w=N和所有δ的解。对于w=N,这意味着r=1,我们必须有γ*= φ[r,y,w]=1表示y≥ 此外,由于y=0,1,对于x=1且x=-1分别为正和非正,我们可以得到γ*= φ[r,y,w]=I作为解。这证明了δ=1情况的第一、第三和第四部分,以及δ<1情况的第一和第五部分(w=N)。接下来,考虑δ=1情况的第二部分。根据引理3,一个x=1且所有r和w<的玩家在购买和不购买y之间无所谓≥ -因此,她可以决定购买。另一方面,x=-1与y+w无关≥ 所以她可以决定不为这些州购买。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 16:09:38
另一方面,如果所提出的策略是FPE 3的解,那么从y+w<N的状态,x=-1可以达到负y(-1或-2)的终止状态,在该状态下,她严格不愿意购买(这可以通过跟踪从y、w到y可以达到的状态来证明-1,w+1,通过策略γ每次显示*= φ[r,y,w]=I)。因此,对于δ=1,x=-1严格选择等待y+w<N和sostrategyγ*= φ[r,y,w]=I可以是y的解≥ -1和w<N。这就完成了δ=1情况的证明。现在考虑δ<1。与δ=1的情况具有相同的参数,因为x=1的玩家对y无所谓≥ -1和δ=1,如果δ<1,她更愿意购买(她因等待而失去估值,没有任何收获)。同样,一个x=-1严格选择y+w购买≥ N和w<N。因此,策略γ*= φ[r,y,w]=1可以是y+w的解≥ N和w<N。对于y的其他州≥ -1,w<N,y+w<N,一个x=-1严格地倾向于等待δ=1,因此,存在较大的2020年3月10日起征量δ<1,因此该玩家仍然倾向于等待,因此,γ*= φ[r,y,w]=I可以是y的解≥ -当δ<1足够大时,w<N和y+w<N。此外,对于w=N- 这就完成了这个定理的证明。参考文献【1】A.V.Banerjee,“羊群行为的简单模型”,《经济学季刊》,第107卷,第3期,第797-8171992页。[2] S.Bikhchandani、D.Hirshleifer和I.Welch,“作为信息级联的时尚、时尚、习俗和文化变化理论”,《政治经济学杂志》,第992-10261992页。[3] L.Smith和P.Sorensen,“观察学习的病理结果”,《计量经济学》,第68卷,第2期,371-3982000页。[4] D.Acemoglu、M.A.Dahleh、I.Lobel和A。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 16:09:47
Ozdaglar,“社交网络中的贝叶斯学习”,《经济研究评论》,第78卷,第4期,第1201-12361011页。[5] T.N.Le、V.G.Subramanian和R.A.Berry,“信息与噪声级联”,《IEEE网络信号和信息处理交易》,第3卷,第2期,第239-251页,2017年6月。[6] B.C,elen和S.Kariv,“不完全信息下的观察学习”,《游戏与经济行为》,第47卷,第1期,第72-862004页。[7] G.Schoenebeck、S.-T.Su和V.Subramanian,“带问题的社会学习”,摘自《网络经济》2019年第19期。[8] V.Bala和S.Goyal,“向邻居学习”,《经济研究评论》,第65卷,第3期,第595-621页,1998年。[9] E.Mossel和O.Tamuz,“使共识易于处理”,《ACM经济学与计算交易》(TEAC),第1卷,第4期,第202013页。[10] E.Mossel、A.Sly和O.Tamuz,“贝叶斯社会网络的渐近学习”,《概率论和相关领域》,第158卷,第1-2期,第127-157页,2014年。[11] ——,《战略学习与社交网络拓扑》,《计量经济学》,第83卷,第5期,第1755-17942015页。[12] M.Harel、E.Mossel、P.Strack和O.Tamuz,“关于社会学习的速度”,arXiv,技术代表,2014年。[13] A.Jadbabaie、E.Mossel和M.A.Rahimian,“贝叶斯群体决策:算法和复杂性”,arXiv,技术代表,2017年。[14] K.Dasaratha、B.Golub和N.Hak,“动态环境中的社会学习”,arXiv,技术代表,2018年。[15] B.C,elen和S.Kariv,“区分信息级联与实验室羊群行为”,《美国经济评论》,第94卷,第3期,第484-4982004页。[16] A.Guarino、H.Harmgart和S.Huck,“聚合信息级联”,《游戏与经济行为》,第73卷,第1期,第167-1852011页。[17] H.Herrera和J.H¨orner,《有偏见的社会学习》,《游戏与经济行为》,第80卷,第131-146页,2013年。[18] A.瓜里诺和P。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 16:09:50
Jehiel,“粗略推断的社会学习”,《美国经济杂志:微观经济学》,第5卷,第1期,第147-742013页。[19] M.H.DeGroot,“达成共识”,《美国统计协会杂志》,第69卷,第345号,第118-121页,1974年。[20] G.Ellison和D.Fudenberg,“社会学习的经验法则”,《政治经济学杂志》,第101卷,第4期,第612-6431993页。[21]-,“口碑传播和社会学习”,《经济学季刊》,第110卷,第1期,第93-125页,1995年。【22】P.Molavi、A.Tahbaz Salehi和A.Jadbabaie,“非贝叶斯社会学习的基础”,哥伦比亚商学院研究论文第15-95号,技术代表,2017年。[在线]。可用:https://ssrn.com/abstract=2683607【23】A.Jadbabaie、P.Molavi、A.Sandroni和A.Tahbaz Salehi,《非贝叶斯社会学习》,《游戏与经济行为》,第76卷,第1期,第210-225页,2012年。[24]Y.Peres、M.Z.Racz、A.Sly和I.Stuhl,“信息级联有多脆弱?”arXiv,技术代表,2017年。【25】A.Nedi\'c、A.Olshevsky和c.A.Uribe,《分布式(非贝叶斯)学习教程:问题、算法和结果》,2016年IEEE第55届决策与控制会议(CDC)。IEEE,2016,第6795–6801页。[26]I.H.Lee,“关于信息级联的融合”,《经济理论杂志》,第61卷,第2期,第395-4111993页。【27】W.Hann Caruthers、V.V.Martynov和O.Tamuz,“顺序渐进学习的速度”,《经济理论杂志》,第173卷,第383-4092018页。[28]D.Vasal和A.Anastasopoulos,“动态博弈中的分散贝叶斯学习”,Arxiv,技术代表,2016年。[在线]。可用:http://arxiv.org/abs/1607.06847March10,2020年草案【29】D.Fudenberg和J.Tirole,“完美贝叶斯均衡和顺序均衡”,《经济理论杂志》,第53卷,第2期,第236-260页,1991年。【30】D.Vasal和A。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群