全部版块 我的主页
论坛 经济学人 二区 外文文献专区
2022-6-10 21:48:07
为了将来的参考,我们注意到dxt=(ui+σ)Xtdt+σXtdfWit,underePi(64)和dΦt=σωΦtdt+ωΦtdfWt,undereP,(65)dΦt=(σω+ω)Φtdt+ωΦtdfWt,undereP。(66)也可以很容易地验证Φ和X通过直接比例有效地联系在一起,即-1Φt=x-ω/σXt公司ω/σe(一)-1/2)ω-ωσ(ui-σ)t、 ePi-a.s.(67)引理6.3。对于(x,Д)∈ R+×R+和(τ,γθ)∈ T×TθRour博弈支付可以重写为bjx,Д(τ,γθ)=xeEДheuτ(1- Γτ) + (1 + )ZτeutdΓti(68)+eEИheuτΦτ(1- Γτ) + (1 + )ZτeutΦtdΓti.此外,我们有bjx,Д(τ,γθ)=Jx,Д(τ,Γ)+ДJx,Д(τ,Γ),其中Jx,Д(τ,Γ)=xeEДheuτ(1- Γτ) + (1 + )ZτeutdΓti(69)和jx,Д(τ,Γ)=xeEДheuτ(1- Γτ) + (1 + )ZτeutdΓti。(70)证明。注意到xt=x eutdePdP,则(68)中的表达式遵循(24)和(29)FXt,P-a.s.,并在推论3.3的证明中进行论证。同样,(69)和(70)紧随(27)和(28)。20蒂齐亚诺·德安吉利斯(TIZIANO DE ANGELIS)、埃里克·埃克斯特罗姆(ERIK Ekstrom)和克里斯托夫·格洛维特(KristoferGloverit)直觉地清楚,如果u=u,球员2就不应该停下来。注意,对于任何Γ∈ A、 分部积分允许我们重写(69)asJx,Д(τ,Γ)=x1+eEДhuZτeut(1- Γt)dt+ZτeutdΓti.使用该u<0,我们立即得到jx,Д(τ,Γ)≥ x个1+eEДhuZτeutdti= Jx,~n(τ,0),即(34)保持不变。因此,命题3.8表明,有必要在γ的子类中寻找纳什均衡∈ γ=+∞ (相当于,Γ=0)。现在我们需要求出剩余的平衡控制Γ*,1和停止时间τ*. 我们首先对τ的结构作出有根据的猜测*和Γ*,然后我们验证了使用这样的猜测,我们可以从定理5.1.6.1中得到拟变分不等式的解。候选人调整的似然比。在u=u的情况下,不对称信息的存在会激励知情玩家不要立即停止,以“愚弄”不知情的玩家。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-10 21:48:11
事实上,如果让不知情的玩家相信漂移很低(即u=u),那么不知情的玩家可以选择提前停止,这对知情玩家有利,因为只需支付较小的报酬。因此,玩家2自然只想在Φ变得太高时停止(即,不知情的玩家坚信漂移为u)。包括上述推理中的随机化思想,我们预计知情的玩家将根据某种“强度”在某个上限停止。随机化的效果是产生一个调整后的似然比Φ*, 这可以解释为知情者进行操纵后,未知情者的信念。因此,对于玩家2来说,这是一个在操纵玩家1的信念和及时停止之间找到最佳权衡的问题。根据上面的启发,我们推测玩家2将构造Γ*,1以反映工艺Φ的方式*= Φ(1 - Γ*,1) 处于较高阈值。考虑到这个想法,让B∈ (0, ∞) andan初始信念∈ (0, ∞) 被给予。众所周知,存在一对独特的过程(Y,L),因此EPД-a.s.one具有(L)t≥0是连续且不递减的,L=0,(71)Y0-= ^1,Y=Д∧ B和Yt∈ (0,B)表示t≥ 0,(72)(Y,L)求解(dYt=σωYtdt+ωYtdfWt- dLt,Rt{Ys<B}dLs=0。(73)那么Y是一个在B处有反射的扩散过程。定义过程ΓB∈ A byΓB0-= 0,ΓB=最大值{0,1- B/Д}和ΓBt=1- (1 - ΓB)e-Lt/B,ePД-a.s.(74)接下来,我们表明,对应于配对Γ=(0,ΓB)的调整后似然比由反映的过程Y给出。提案6.4。修复B∈ (0, ∞), 并考虑上述过程(Y,L)和ΓBas。然后对于任何类型∈ (0, ∞) 我们有ΦBt:=Φt(1- ΓBt)=Yt,对于所有t≥ 0,ePД-a.s.(75)证明。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-10 21:48:15
注意,(73)意味着dLt=1{Yt=B}dLtwe可以在(73)中写出第一个方程,即dyt=σωYtdt+ωYtdfWt- B-1年初至今。具有不完全和不对称信息的DYNKIN博弈21现在回想(71)–(72),由于上面的等式,我们可以在EPДasYt=(Д)下显式写出Y∧ B) 经验值ωfWt+(σω-ω) t型- B-1吨.将上述表达式与ΓBin(74)和Φin(65)进行直接比较,得出(75)。下面,我们根据本节开头提到的猜想,制定并解决一个变分问题:玩家2将选择一个阈值B∈ R+并采用夫妻产生的随机停止时间(0,ΓB)∈ A×A。玩家1将选择阈值A∈ (0,B)并在τA处停止:=inf{t≥ 0:ΦBt≤ A} 。(76)6.2. 线性支付问题的拟变分不等式。在这里,我们使用一种构造性的方法来获得拟变分不等式的候选解,然后我们将在下一节中根据定理5.1的要求进行测试。如上所述,我们寻求与Γ的平衡*,0≡ 如果游戏者2玩Γ=(0,ΓB),而游戏者1玩τA,我们从(69)Jx,ν(τA,Γ)中获得*,0)=xeEД[euτA]=:xV(Д)。(77)我们的想法是,我们应该在定理5.1中验证u(x,Д)=xV(Д)和uas。这将在定理6.10中使用本节收集的事实。很容易检查(参见,例如,【36】)VSaties(78)ωДV(Д)+σωДV(Д)+uV(Д)=0,Д∈ (A,B)V(Д)=1,Д∈ (0,A)V(B)-) = 请注意,B处的条件是通常的正常反射条件。此外,观察EPД(ΦB=B)=1表示Д≥ B、 因此,对于φ,EEД[euτA]=eEB[euτA]≥ B、 因此,v(Д)=0,Д≥ B、 (79)此外,我们还注意到u<0表示V(Д)≤ 1, φ ≥ A、 (80)相反,It^o公式的应用给出了MMA 6.5。假设存在“V”∈ C([A+∞)) ∩ 解(78)–(79)的C([A,B])。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-10 21:48:18
然后'V(Д)=eEДeuτA= V(Д)。接下来,我们介绍一个函数xV(Д),我们想将其与(70)中的Jx,Д(τa,ΓB)联系起来。我们根据以下逻辑为Vac计算了一个边值问题:(i)在区间(a,B)中,两个参与者都不应该停止,因此函数V应该表现为ΦB的过程,其创建速率为u;(ii)只有当过程ΦB超过B时,知情玩家才会停止(尽管在B的第一次击球时间内并非必要)。那么我们期望V(B)=1+;(iii)对于玩家2来说,B的选择是最优的(假设玩家1使用τA),经典平滑条件应保持不变,即我们期望V(B-) = 0;(iv)如果未知情的参与者首先停止(根据τA),那么参与者2的成本为V(A)=1。结合以上四项,我们得到了边值问题(81)ωДV(Д)+(ω+σω)ДV(Д)+uV(Д)=0,Д∈ (A,B)V(Д)=1,Д∈ (0,A)V(Д)=1+, φ ∈ [B,∞)V(B)=0.22 TIZIANO DE ANGELIS,ERIK Ekstrom和Kristofer GLOVERNotice,如果V∈ C([A+∞)) ∩ C([A,B])解决了上述系统,然后由于it^o演算的应用,很容易验证xv(Д)=Jx,Д(τA,ΓB)(82)。此外,我们可以建立V的单调性,这将在本节后面的部分中有用。引理6.6。假设0<A<B和V∈ C([A,B])解(81)。然后V(Д)≥ ^1为0∈ [A、B]和1≤ V(Д)<1+ 对于^1∈ [A,B).证明。让我们从观察(81)中的第一、第三和第四个方程开始,这意味着ωBV(B-) = -u(1 + ) < 0。上述和V(B)=0意味着存在λ>0(B- λ≥ A) V(Д)>0,表示Д∈ (B)- λ、 B)。(83)为了达成矛盾,假设存在∈ (A,B)使得V(Д)<0。然后我们还可以定义:=sup{ν∈ (A,B):V(Д)<0},且明显为c∈ (A、B- λ]. 由于Vit的连续性,V(c)=0。由于常微分方程是欧拉型的,其解是幂函数的线性组合;因此V∈ C∞(A、B)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-10 21:48:21
然后,设置V:=对(81)中的第一个方程进行微分,我们得到V必须解决边值问题(84)ωДv(Д)+(2ω+σω)Дv(Д)+αv(Д)=0,Д∈ (c,B),v(c+)=v(B-) = 0,α:=ω+σω+u。然后,例如通过费曼-卡克公式,v(Д)=0表示Д∈ (c,B),这与(83)相矛盾。然后V(Д)≥ 如所述,在[A,B]中为0。此外,1≤ V(Д)<1+ 对于^1∈ [A,B),通过(81)中的第二个和第三个等式。此后,当提及大众汽车时,将隐含地假设它解决了(81)(我们在下一节中显示,以下(81)和(85)可以以独特的方式同时解决)。回顾(68)现在很自然地将jx,Д(τA,0,Γ1,B)与函数xv(Д):=x(V(Д)+ДV(Д))。使用(78)和(81)中的第二个等式,我们立即看到V(A)=1+A。此外,回顾(29),函数Ξ(x,Д):=xV(Д)/(1+Д)应表示代理形式游戏中未知情玩家的均衡支付(请注意,实际上Ξ(x,A)=x)。因此,通过最优性,我们期望经典光滑条件在边界A处成立,即ΞΞ(x,A+)=0,或等效地,V(A+)=1。因此,使用(78)和(81),我们得出V应该解决边值问题(85)ωДV(Д)+σωДV(Д)+uV(Д)=0,Д∈ (A,B)V(Д)=1+Д,Д∈ (0,A)V(A+)=1,V(B-) = 1 + .此外,V(Д)=1+, φ ≥ B(86)乘以(79)和(81)。在结束本节之前,我们将提供V的一些有用属性。引理6.7。假设V∈ C([A,B])解(85)。然后V(Д)>1+Д,V(Д)>1表示Д∈ (A、B)。具有不完全和不对称信息的DYNKIN对策23证明。首先请注意,ODE是Euler类型,因此V∈ C∞(A、B)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-10 21:48:25
区分(85)中的第一个方程,并对增值税A和增值税B施加边界条件,我们发现v:=Vsolves(87)ωДv(Д)+(ω+σω)Дv(Д)+uv(Д)=0,Д∈ (A,B)v(A+)=1,v(B-) = 1 + .回顾ΦundereP的动力学(见(66)),设置ρA:=inf{t≥ 0:Φt≤ A} ρB:=inf{t≥ 0:Φt≥ B} ,并使用It^o的公式,我们很容易得到v(Д)=eEДheu(ρA∧ρB)v(ΦρA∧ρB)i(88)=eEДheu(ρA∧ρB)i+eEДheuρB{ρB<ρA}i。现在引理中的两个权利要求都来自(88),因为u>0,并且回顾V(Д)=1+Д≤ A.最后,我们注意到引理6.7和V(A+)=1这一事实意味着V(A+)≥ 0.然后将(85)的第二和第三个方程插入第一个方程,并使用V(A+)≥ 0我们得到ωAV(A++σωA+u(1+A)=0==> uA+u≤ 0下一个推论成立。推论6.8。假设V∈ C([A,B])解(85)。那一定是≤ -u/u.6.3. 变分问题的解和纳什均衡。现在我们证明了(81)和(85)可以用一种独特的方式同时求解。请注意,一旦找到函数V和Vand以及边界点A和B,函数Vis将根据关系V(Д)自动确定:=V(Д)- ^1V(Д)。Vin(81)ODE的一般解为(89)V(Д)=CДβ-1+CИβ-1,其中Cand Care常数和β∈ (0,1)和β<0是二次方程ωβ(β)的解- 1) + σωβ + u= 0.(81)中的第三和第四个边界条件可用于确定Cand CasC=(1- β)(1 + )β- βB1-β和C=(β- 1)(1 + )β- βB1-β.根据条件V(A)=1和导出的Cand C表达式,我们得出方程(90)(1- β)AB公司β-1+ (β- 1)AB公司β-1=β- β1 + .引理6.9。存在唯一的a/B值∈ (0,1)满足(90)。证据设h(z)=(1- β) zβ-1+ (β- 1) zβ-1.- (β- β)/(1 + ) 我们可以看到h(z)=(1- β)(β- 1)zβ-2.- zβ-2.> z为0∈ (0,1)自β∈ (0,1)和β<0。此外,limz↓0h(z)=-∞ h(1)=(β- β)/(1 + ) > 0
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-10 21:48:28
因此,我们得出结论,在(0,1)中存在唯一的根h(z)=0。24 TIZIANO DE ANGELIS、ERIK EKSTR¨OM和Kristofer GLOVERNext,对于常数和D,(85)中V的ODE通解为(91)V(Д)=DДβ+DДβ。可以使用(85)中的第二和第三边界条件来确定,并且DasD=A-ββ- β[-β+ (1 - β) A]和D=A-ββ- β[β+ (β- 1) A)]。根据边界条件V(B-) = 1 +  和D的导出表达式,我们得到了方程(1+)(β- β) B=(A/B)-ββ[β+ (β- 1) A]- (A/B)-ββ[β+ (β- 1) A)]。将(90)的唯一根表示为δ=A/B∈ (0,1)我们设置A=δB以获得(1+)(β- β) B=δ-ββ[β+ (β- 1) δB](92)- δ-ββ[β+ (β- 1) δB]。线性方程(92)具有唯一解(93)B=ββ(δ-β- δ-β)(1 + )(β- β) - β(β- 1)δ1-β+ β(β- 1)δ1-β、 使用δ可以直接检查B>0∈ (0,1)在分子和分母中。从上面我们可以看到,A和B由(90)和(93)唯一确定,相应的候选值Vand V分别由(89)和(91)给出。请注意,为了在(0)上定义V+∞) 我们简单地通过取V(ν)=V(B)+(1)+,在Cway中扩展上面构造的V)(φ - B) ,用于^1≥ B、 (94)V(Д)=1+Д,表示Д≤ A、 (95)此外,我们扩展了Vto[B+∞) 在Cway和to(0,a)中,通过取v(Д)=1+, 对于^1≥ B、 (96)V(Д)=1,表示Д≤ A、 (97)定理6.10。设A<B是(90)和(93)的唯一解,设Vand V在(89)和(91)中用(94)–(97)构造。表示V(Д):=V(Д)- ДV(Д)并回忆ΦBandτAfrom(75)和(76)。LetΓ*= (0,ΓB),设γ*θ是由Γ生成的随机停止时间*, 和设置τ*:= τA.然后随机停止对(τ*, γ*θ) 是具有(62)中所述线性支付的代理formgame的纳什均衡(即事前博弈的鞍点)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-10 21:48:31
此外,对于所有(x,Д)∈ R+×R+我们有bjx,ν(τ*, γ*θ) =xV(Д),Jx,Д(τ*, 0)=xV(Д),Jx,Д(τ)*, ΓB)=xV(Д)。证据证明依赖于证明定理5.1中的u(x,Д):=xV(Д)和ui(x,Д):=xVi(Д),i=0,1,完全满足所有条件。让我们从设置开始,对于i=0,1,C:{(x,Д):u(x,Д)>(1+Д)x}和Ci:{(x,Д):ui(x,Д)<(1+)x} 信息不完全和不对称的DYNKIN对策,S:=R+\\C,Si:=R+\\Ci。根据引理6.6和(81)中的第二个方程,我们得到C=R+×(0,B)和S=R+×[B+∞). 类似地,从(86)和引理6.7我们得到C=R+×(A+∞)和S=R+×(0,A)。由于V和Vsolve(85)–(86)和(81)分别为,立即检查Vsolves(78)–(79)。此外,引理6.5保证Valso满足(77)。那么(80)也成立,意味着C=R+和S=.既然规定了C、Ci、S、SiA,很容易检查S上的Lu(x,Д)=L[x(1+Д)]=x(u+uД)≤ 0,(98),其中最后一个不等式来自推论6.8(回想一下,Li是度量Pi下(X,Φ)的微型生成器)。因此,(98)和(85)意味着(42)。此外,(78)和(81)表示(43)。此外,(78)和(81)中的第二个方程表示(44),(79)和(81)中的第三个方程表示(45)。最后,ui(x,ν)≤ x(1+) 对于i=0,1乘以(80)和引理6.6。很明显,(Xt,ΦBt)t≥0施工满足条件(46)–(48),因为我们考虑的所有概率度量在Ft上是等效的,对于每个t<∞. 此外,Pi(τA<∞) = 1由于τ是反映扩散的恒定水平的第一次击中时间,因此P(τa<∞) =(1 - π) P(τA<∞) + πP(τA<∞) = 1、只剩下检查横截性条件(49)。首先,我们注意到τn(u)和τn(ui),i=0,1,如(41)所定义,收敛为n→ ∞ 由于u和ui的规则性,在PiandePi下,i=0,1。使用ΦBt∈ [0,B]对于所有t≥ 0,Px,Д-a.s。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-10 21:48:35
以1为界,我们得到0≤ 画→+∞Ex,ДhXτnV(ΦBτn)1{τA>τn}i≤ 画→+∞由于P-几何布朗运动{Xt,t≥ 0}是一致可积的。因此(49)适用于i=0。为了证明(49)的i=1,我们从(81)和伊藤公式的一个应用中可以看出,zt:=eu(t∧τA)V(ΦBt∧τA)是aePД-鞅。通过Fatou引理,eEheτAi≤ 限制→∞eEИheu(t∧τA)V(ΦBt∧τA)i≤ V(Д)<∞,这也意味着EP(τA<+∞) = 1,根据以下需要。最后,我们有0≤ 画→+∞Ex,ДhXτnV(ΦBτn)1{τA>τn}i≤ (1 + ) 画→+∞限制→+∞Ex,ДhXτn{τA∧t> τn}i=x(1+) 画→+∞限制→+∞eEДheuτn{τA∧t> τn}i≤ x(1+) 画→+∞eE^1euτn{τA>τn}= 0,我们使用ΦBt的地方∈ [0,B]对于所有t≥ 0,ePД-a.s.和以1+ 在(0,B)上,最后一个等式是由于支配收敛。回顾我们问题中的事前价值是xV(Д)和x≥ 0,一个最终观测值涉及到相对于ν的凸度(自V≥ 0,这也等价于关于π的凸性)。结果与文献[1]中关于不对称信息博弈的现有文献一致,与文献[6]、[7]、[21]、[22]和[23]中的最新结果一致。提案6.11。地图Д7→ V(Д)在[0]上是凸的,∞).证据结果可以通过V的显式表达式导出,但需要检查所有相关常数的符号。我们采用另一种方法,利用(A,B)解(90)和(93)的唯一性。26 TIZIANO DE ANGELIS、ERIK Ekstrom和Kristofer GLOVERFirst,我们观察到如果存在≤ φ< φ≤ B使得V(Д)=V(Д)=0,则V=0在间隔(Д,Д)上。这可以很容易地由最大值原理推导出来,注意到V=:^V通过(87)的直接微分求出ωИ^V(Д)+(2ω+σω)ДV(Д)+(ω+σω+u)^V(Д)=0on(Д,Д)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-10 21:48:39
因为1=V(A+<V(B-) = 1 +  (A,B)上的V>1,我们得出结论→ V(Д)最多可以改变一次单调性。特别是,它在达到其全球最大值时不会减少,即对于所有的Д∈ (A,Д)带Д:=inf{Д∈ 【A,B】:V(ν)=最大∈[A,B]V(ν)}。如果V(Д)>1+, 然后存在B∈ (A,Д)使得V(B)=1+ 这对(A,B)也是(90)和(93)的解,用同样的构造,得到这些方程。这与解决方案的唯一性相矛盾。因此,V(Д)=1+ ν=B。那么Vis单调,V是凸的。数值结果在本节中,我们说明了第6节中发现的代理形式博弈中事前博弈和纳什均衡的价值。我们考虑u=-1,u=1,σ=0.5和 = 0.1. 对于这些参数,(90)和(93)确定的边界为A=0.329和B=0.868。然而,为了便于解释,下面我们将返回后验概率过程∏*, 其中,我们将下边界表示为a:=a/(1+a),将上边界表示为b:=b/(1+b)。对于我们的基本情况,这对应于a=0.248和b=0.465。此外,我们假设x=1,并注意到u(1,Д)=V(Д),ui(1,Д)=Vi(Д);因此,我们参考V和Vias值函数。最后,由于u=u{θ=0}+u{θ=1},我们将停止引用θ,并直接使用事件{u=u}和{u=u},这两个事件具有明确的直观含义。首先,图2展示了∏的典型示例路径*-过程及其相关Γ*,1过程。注意,在这个特定示例中,播放器1在τ处停止*≈ 0.06*,1τ*≈ 0.13.因此,如果u=u或u=u且统一分布随机化装置U的值大于0.13,则播放器1在播放器2之前停止。(a) (b)图2。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-10 21:48:42
π的典型样本路径*-过程(左)及其相关Γ*,1基本案例参数的流程(右)。请注意,左侧的虚线表示最佳边界a=0.248和b=0.465,我们选择了π=0.35。具有不完全和不对称信息的DYNKIN游戏27接下来,图3显示了与我们的基本情况相对应的玩家1和玩家2的值函数。请注意,V和V分别满足a和b处的光滑条件,V满足b处的反射条件。我们还观察了(79)和(80)中描述的V的性质,以及引理5.5和5.6中分别描述的Vand V的性质。还观察到命题6.11中所述的事前值V的凸性。当真实漂移为u时,informedplayer期望支付的金额远远超过玩家1有理由相信的金额,而当真实漂移为u时,知情玩家期望支付的金额更少。当u=u时,1+ 而游戏对玩家2的价值可以看作是由于玩家1不知情而减少了玩家2的预期成本。类似地,当u=u时,1与玩家2的游戏价值之间的差距表示由于玩家1不知情,玩家2的预期成本减少。图3:。游戏对玩家1的价值(实线;(1)- π) V+πV)以及当u=u(虚线;V)和u=u(虚线;V)时游戏对玩家2的价值。基本情况参数为u=-1,u=1,σ=0.5和 = 0.1;因此,a=0.248,b=0.465(由两条垂直线表示)。图4显示了所有四个参数(u、u、σ、,) 使用上述基本情况。我们首先注意到,信噪比ω=(u-u)/σ对理解这些结果起着至关重要的作用,因为ω越高,未知玩家的学习速度越快。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-10 21:48:45
从这个意义上讲,参数u、u和σ的变化将影响信噪比,从而影响学习速度,这最终将对平衡结果产生影响。此外,改变u、u和σ不仅会影响学习速度(通过信噪比),还会影响游戏的预期收益,由于这些竞争效应,可能会导致非单调依赖性。最后,我们注意到 只有通过游戏的支付结构影响问题,并且对玩家1了解漂移的速度没有影响。考虑到这一点,我们现在开始描述图4中观察到的比较静力学结果。我们首先考虑变化u对平衡结果的影响。随着u的增加(allelse相等),播放器1的良好情况会变得更好,这既是因为漂移更大,也是因为信噪比增加,从而加快了学习过程。这表明阈值a应在漂移u中减小,这也在数值上得到证实,见图4(b)。同样,如果u=u且u很大,那么继续对玩家2来说代价高昂,在28号TIZIANO DE ANGELIS,ERIK Ekstrom和Kristofer GLOVER(a)(b)(c)(d)图4。基本情况参数(u=-1,u=1,σ=0.5和 = 0.1)当我们改变u、u、σ和, 分别地同时,具有关于漂移的附加信息的优势较小(因为信噪比增加)。因此,阈值b应以u为单位减小,这在数值上也得到了证实。当考虑u的变化时,对两个参与者都有两个相互竞争的影响。一方面,减少u对玩家1(sup玩家)不利,因此对阈值a的影响越来越大。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-10 21:48:47
另一方面,u的减小会增加信噪比,从而加快学习过程,从而降低a。图4(a)证实了a对u存在非线性依赖的怀疑。出于上述相同的原因,u的变化对上阈值b的影响是不明确的。然而,对于我们的基本情况参数,在图4(a)中看不到这种潜在的模糊性。从图4(c)中,我们可以看到,随着σ的增加,玩家1的最佳阈值增加,而玩家2的最佳阈值减少。这背后的直觉是,随着σ的增加,信噪比增加,导致学习速度变慢,因此玩家1的值函数变小,因此a增加。然而,对于玩家2来说,σ增加意味着他们能够更好地隐藏玩家1的信息(增加b的动机),π过程方差的减少也意味着σ增加时,给定阈值的首次命中时间更大。由于u>0,更长的预期停止时间最终将导致玩家2的预期成本增加(减少b的动机)。通过数值计算,我们的基本情况参数的最终结果是,玩家2随着σ的增加降低了他们的阈值b。最后,我们考虑了. 自 不影响玩家1了解漂移的能力,其对均衡的影响只能通过具有不完整和不对称信息结构的Payoffdynkin博弈来实现。因此,所有的值函数在; 对于玩家1来说,这意味着延续区域在, 使阈值a减小。然而,b的noeasy单调性可以推断出来,因为对玩家2的延续区域没有明显的影响(因为障碍也取决于).
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-10 21:48:50
从图4(d)中,我们观察到a对 并且,对于我们的基本情况参数,b在.最后,为了计算博弈中的信息价值,我们在文章的最后对信息对称和不完全的情况进行了非正式讨论。假设两个参与者对u具有相同的初始先验分布,即他们同意π作为初始概率,即dRIFT为u,并且1- π表示漂移为u的概率。然后,不需要对其他玩家进行随机操作,就可以获得停止时间(τ,τ)的鞍点。事实上,具有线性支付的博弈减少了toU(x,Д)=x1+ДsupτinfτeEeuτ(1+Φτ)1{τ<τ}+(1+)euτ(1+Φτ)1{τ≤τ}式中,dΦt=σωΦtdt+ωΦtdfWtundereP。然后可以直接检查是否可以找到A、B∈ (0, ∞) A<B,A函数bv+1≤bV公司≤ (1 + )(1+Д)以便ωДbV(Д)+σωДbV(Д)+ubV(Д)=0,表示Д∈ (A,B)bV(Д)=1+A,表示Д∈ (0,A)bV(A+)=1,bV(Д)=(1+)(1+B),用于∈ [B,∞)bV(B-) = 1 + .使用标准验证参数,(τ*, τ*) := (τA,τB)是停车时间的鞍点,相应的值函数由U(x,Д)=xbV(Д)/(1+Д)给出。图5:。左边:对称不完全信息情况下(实线)两个参与者的共同值函数,与不对称情况下(虚线)的值函数相比。两条垂直线对应于值SA:=A/(1+A)和b:=b/(1+b)(对于对称情况)。右侧:这些值之间的差异,代表了我们游戏中信息的价值。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-10 21:48:53
基本情况参数:u=-1,u=1,σ=0.5和 = 0.1,即yieldsa=0.193,b=0.758(对于对称情况)。30 TIZIANO DE ANGELIS、ERIK EKSTR¨OM和Kristofer Glover图5绘制了基本情况参数的值函数U(1,π)=U(x,π)/x,以及非对称情况下未知情玩家的值函数,以供比较。还绘制了不对称值函数和对称值函数之间的差异,并可解释为此设置中的信息值。参考文献[1]Aumann,R.和Maschler,M.在信息不完全的情况下重复博弈。麻省理工学院出版社,马萨诸塞州剑桥,1995年。[2] Adams,R.A.和Fournier,J.J.F.Sobolev空间(第二版)。学术出版社2003年。[3] Back,K.《资产定价理论中的不完全和不对称信息》。《金融中的随机方法》,数学讲师1856(2004),1-25。[4] Bather,J.A.Bayes确定正态均值符号的程序。过程。剑桥菲洛斯。Soc。,58 (1962),599-620.[5] Bensoussan,A.,Friedman,A.具有停止时间和自由边界问题的非零和随机微分对策。变速箱。美国。数学Soc。,231(1977)第2号,275-327。[6] Cardaliaguet,P.《信息不对称的差异博弈》。暹罗J.控制优化。46(2007),第3816-838号。[7] Cardaliaguet,P.和Rainer,C.具有不对称信息的随机微分对策。应用程序。数学Optim公司。59(2009),第1、1-36号。[8] Cherno Off,H.正态分布平均值的序贯检验。过程。第四届伯克利研讨会。数学统计学家。和问题。,1 (1961), 79-91.[9] Daley,B.和Green,B.在柠檬市场等待消息。《计量经济学》80(2012),第4期,1433-1504。[10] De Angelis,T.《部分信息的最优股息和退化反射差异的停止》。金融斯托克。24(2020),第1号,71-123。[11] De Angelis,T.、Ferrari,G.、Moriarty,J。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-10 21:48:56
两人非零和停止博弈的阈值型纳什均衡。安。应用程序。概率。,28(2018),第1112-147号。[12] De Angelis,T.、Gensbitel,F.和Villeneuve,S.这是一个关于资产的Dynkin游戏,其回报信息不完整。数学操作。Res.(2020),将出现。[13] D\'ecamps,J.-P.、Mariotti,T.和Villeneuve,S.不完全信息下的投资时机。数学操作。第30(2005)号决议,第472-500页。[14] Dynkin,E.B.最优停止问题的博弈变体。苏联数学。Dokl。10 (1969), 16-19.[15] Ekstrom,E.、Glover,K.和Leniec,M.Dynkin具有异质信念的游戏。J、 应用程序。概率。54(2017),第1236-251号。[16] Ekstrom,E.和Peskir,G.马尔可夫过程的最优停止对策。暹罗J.控制优化。47(2008),第2号,684-702。[17] Ekstrom,E.和Vaicenavicius,J.漂移不确定性下资产的最优清算。暹罗J.Financ。数学7(2016),第1357-381号。[18] Ekstrom,E.和Vannestal,M.美国期权和不完整信息。内景J.Thero。应用程序。资金22(2019)no.61950035,14 pp.【19】Fleming,W.H.和Soner,H.M.《受控马尔可夫过程和粘度溶液》(第25卷)。Springer Science&Business Media(2006)。[20] Gapeev,P.《部分信息模型中永久美式期权的定价》。内景J.Thero。应用程序。财务15(2012),第1号,ID 1250010。[21]Gensbitel,F.信息不对称的连续时间马尔可夫博弈。Dyn公司。游戏应用程序。9(2019),第3671-699号。[22]Gensbitel,F.和Gr–un,C.信息不对称的零和停止博弈。数学操作。第44号决议(2019年),第1号,277-302。[23]Gr–un,C.关于信息不完全的Dynkin游戏。暹罗J.控制优化。51(2013),第5号,4039-4065。[24]Harsanyi,J.“贝叶斯”玩家玩的信息不完整的游戏。一、 基本模型。管理科学。14 1967 159-182.【25】Kifer,Y.游戏选项。金融斯托克。4(2000)号。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-10 21:49:00
4, 443-463.[26]Lakner,P.《部分信息效用最大化》。随机过程。应用程序。56(1995),第2号,247-249。[27]Lakner,P.《投资者的最佳交易策略:部分信息案例》。随机过程。应用程序。76(1998),第1号,77-97。[28]Laraki,R.和Solan,E.连续时间零和停止对策的值。暹罗J.控制优化。43(2005),第5号,1913-1922年。[29]Lempa,J.和Matom–aki,P.一个信息不对称的Dynkin博弈。随机85(2013),第5763-788号。【30】Lepeltier,J.-P.和Maingueneau,M.A.Le jeu de Dynkin en the eorie g'en'erale sans l\'hypoh\'ese de Mokobodski。《随机13》(1984),第1-2、25-44号。具有不完全和不对称信息的DYNKIN对策31【31】Liptser,R.S.和Shiryaev,A.N.随机过程的统计。第2卷。数学应用,6。Springer Verlag,纽约,1977年。[32]Lu,B.不完全信息下跳跃资产的最优出售。应用程序。数学财务20(2013),第6期,599-610。【33】Monoyios,M.《部分和内部信息下的最优投资和对冲》。高级金融建模、Radon计算和应用数学系列。8 (2009), 371-410.[34]Revuz,D.和Yor,M.连续鞅和布朗运动。第293卷。Springer Science&BusinessMedia,2013年。【35】Shiryaev,A.N.《序列分析的两个问题》。控制论,3(1967),第2期,63-69。【36】Shreve,S.E.、Lehoczky,J.P.和Gaver,D.P.具有吸收和反射屏障的一般差异的最佳消费。暹罗J.控制优化。,22(1984),第1期,第55-75页。【37】Touzi,N.和Vieille,N.采用混合策略的连续时间Dynkin游戏。暹罗J.控制优化。,41(2002),第4号,1073-1088。[38]Ziegler,A.连续时间金融中的不完全信息和异质信念。Springer Verlag,纽约,2003年。T
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-10 21:49:03
德安吉利斯:英国利兹大学数学学院,LS2 9JT利兹。E、 Ekstrom:瑞典乌普萨拉大学数学系,邮箱480,75106乌普萨拉。K、 格罗弗:悉尼理工大学,新南威尔士州百老汇123号邮政信箱,2007年,澳大利亚。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群