全部版块 我的主页
论坛 经济学人 二区 外文文献专区
2022-5-8 14:06:03
因此,当L>M时,关节质量点是不可能的。然而,如果L≡ M(例如,在消耗模型中);见附录中的备注B.1。定理5.1的平衡到目前为止只能处理满足Mθ的子对策≥ Fθon{Lθ>Fθ}。因此,如果我们想将它们聚合为一个子博弈完美均衡,我们必须假设目前所有的子博弈都是这样。然后设置τθ=inf{t≥ θLt>Ft或Mt>Ft}将满足存在条件。在特殊情况下,F≥ max(L,M)贯穿始终,这意味着s意味着τθ≡ ∞ 然后,Lτθ=L和DτθL=DL。在这种情况下,停止率不依赖于θ,这确保了时间的一致性。然而,一般来说,我们可能有DτθL6=DLon[θ,τθ],特别是当max(F,M)>Lor max(F,M)<ULatτθ∞. 如果未通过,则τθ的时间一致性要求不会改变,但对于任意两个τ,τ′∈ T,我们应该把τθ=τθ′放在{θ≤ θ′≤ τθ}反之亦然,或者总之τθ=τθ′on{(θ∨ θ′) ≤ (τθ∧ τθ′)}.然后,我们确实获得了具有标准混合策略的支付对称子博弈完美均衡,例如,具有系统后动优势的博弈。在这种情况下,dGθi将是一个奇异测度,这通常出现在布朗模型的最优控制中。参见Riedel和Steg(2017)中的定理3.3,以及他们关于不对称博弈问题的第4.3节。示例:如果L(>M)不是右连续的,则没有对称的支付公式。FLMTT对于t的玩家i来说是绝对最优的∈ (T,T)如果Gj(T-) > Gj(t),so-Gi(t-) = Gi(T)和Gj(T)-) = Gj(T)通过payoff对称,给出(T,T)上的一个连续payoff(T)。唯一的对称延续payoff是从Gi(T)=Gj(T)∈ (0, 1). 等待在[0,T]上也是严格占主导地位的,但在低于T时停止比在T时停止产生更高的报酬。定理5.3.修正i,j∈ {1,2},i6=j。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 14:06:08
如果(Gθi;θi)∈ T),(Gθj;θ∈ T)真的如此吗∈ T,Gθi,Gθj在Orem 5.1中满足子博弈中从θas开始的均衡条件,以及相关的(τθ;θ)∈ T)在{(θ)上满足τθ=τθ′a.s∨ θ′) ≤ (τθ∧ τθ′)对所有人来说∈ T,那么(Gθi;θi)∈ T)和(Gθj;θ∈ T)代表标准混合策略的子博弈完美均衡。例如,如果最大(英尺-中尉,Mt-(英国《金融时报》)≥ 0代表所有t∈ R+a.s.和τθ=inf{t≥ θLt>Ftor Mt>Ft}∈ T证据:见附录B.1。即使家庭所需的时间一致性条件(τθ;θ)∈ T)保持,家族(DτθθL;θ∈ T)需要诱导时间一致的停止率(dGθi;θ∈ T)。这是定理5.3(证明)的要点,给出了定理5.1.6的最优性示例:退出双寡头垄断在本节中,我们说明了定理5.1中指出的系统后动优势所导致的简化。特别是,我们通过明确推导示例2.3中一个市场退出博弈版本的斯奈尔包络及其补偿函数来确定子博弈完美均衡策略。因此,损耗期间的停止率表示为不可恢复操作造成的持续损失。为了指定模型,假设在每个时间t,折扣双寡头利润由πDt=e给出-rt(Yt)- c) ,其中c>0是一个恒定的运营成本和收入(Yt)t≥0遵循几何布朗运动解dYt=uYtdt+σYtdBt。剩余垄断者的利润流为πMt=e-rt(mYt)- c) ,其中m>1。每个企业都可以决定离开市场,并获得累计回报Lt=Mt=Rte-rs(Y)- c) 例如,当Y非常低,以至于收入不足以支付生产成本时。在这样一个阶段,如果垄断似乎仍然有利,那么游戏就是一场消耗战。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 14:06:12
然而,在跟随者的问题中,如果payoff Ft=Lt+ess supτF,立即停止也可能是最佳选择∈T:τF≥tEZτFte-rs(mYs)- c) ds英尺.后一个问题是在r>max(u,0)条件下的标准练习,其唯一性这也是必要的,并且对于根据假设2属于(D)类的过程是有效的。1.那么-c/r≤ 书信电报≤R∞E-卢比- c|ds∈ L(P)和类似地,对于F,插入m。当Y从Yt开始,低于阈值ym=ββ时,解就停止- 1r- urcm<cm,其中β是二次方程σβ(β)的负根- 1) + uβ - r=0。停止问题的值可以明确表示为ft- Lt=e-rt{Yt>ym}mYtr- u-铬-Ytymβmymr- u-铬, (6.1)表明F是一个连续过程,Fτ对应于τ的最优跟随决策∈ T和Ft=Lt(=Mt)<=> Yt≤ 嗯。因此,对于定理5.1中的任何平衡,我们需要τθ≥ inf{t≥ θ|Yt≤ ym}表示端点条件。另一方面,对垄断者来说,一旦停止,就意味着垄断的主导地位≤ ym,在双寡头垄断中也是如此,那里的收入永远不会超过垄断中的收入。因此,我们可以选择τθ=inf{t≥ θ|Yt≤ ym}而不丧失普遍性,它将在任何θ处导致s对称平衡∈ T如下所示。因为F是m的一个超鞅≥ 1支配了L,它也支配了后者的斯奈尔包络,所以我们有F=L=> F=UL=L。因此,理论5中的@Lτθ。1就在这里,我在τθ停了下来,斯奈尔包络UτθθL包含了uUntilτθ。应用(6.1)的右侧,m=1,得到最优停止领导者(双头垄断)支付的解:UL(t)=ess supτ∈T:τ≥tE[Lτ| Ft]=Lt+e-rt{Yt>y}Ytr- u-铬-伊蒂β你- u-铬.应用o引理,证明了超鞅ULis的单调部分仅仅是dLiftddl(t)=-1{Yt<y}dLt=1{Yt<y}e-rt(c)- Yt)当立即停止时,DTL是最优的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 14:06:16
τθ=在f{t中≥ θ|Yt≤ ym}对于每一个θ∈ T,dDτθL=dDL,和(6.1),我们现在有了一个完全显式的对称子博弈完美均衡,其支付分别为Vθi(Gθi,Gθj)=UL(θ)。当ym<y<c时,我们看到DDL仅仅是由于不可操作的操作而导致的损失流。如果一个双头垄断者从未希望成为垄断者,这些损失将太大,无法继续经营下去。在这里,只要有人∈ (ym,y),两家公司正以直接取决于运营亏损的速度退出双寡头垄断;这一数字在下降。该州可能会在该地区(y,c)附近崛起。然后仍有亏损,但企业暂停混合,因为等待市场复苏的选择非常有价值。因此,不需要补偿。通常,会有连续和不混合的交替周期。然而,当国家降至[0,ym]时,即使一家公司是(可能会成为)垄断者,并且两家公司都立即退出,面对经营亏损,等待市场复苏的选择将毫无价值。7一般对称博弈的平衡7。1扩展混合策略的抢占在抢占情况下,即当存在先发优势L>F时,连续时间内纯策略通常不存在均衡。Fudenberg和Tir ole(1985年)以及Hendricks和Wilson(1992年)表明,当有等待的动机时,就会出现这个问题(Lis增加)。如果模型具有充分的规则性,且先发优势是严格的,那么在标准的混合策略中,一方可能存在均衡,一方立即停止,另一方以足够的速度停止,这样第一方将无法实现L的增加。因此,收益是不对称的,L和F。然而,这些平衡不能扩展到抢占区域的边界;如果L=F,那么支持任何平衡所需的停止率就会爆炸。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 14:06:19
这种观察不依赖于任何规则性条件——支付过程可以是确定性的、任意平滑的。因此,如果我们想在先发制人即将开始时(或在L>F时也考虑对称支付)考虑任何均衡,那么我们需要丰富策略和结果空间。关键是当球员试图同时停球时,促进部分协调,但同时停球将是最糟糕的结果。因此,我们现在将使用定义2.4中的策略扩展。有了这些扩展策略,就有可能捕捉到对称、混合离散时间平衡点的连续时间极限,而这些平衡点没有以前的问题。然后,我们获得了具有绝对优势的su bgames的以下立即停止均衡——这里是s对称博弈:7.1号提案(参见Riedel and Steg(2017)中的3.1号提案)。修好∈ 假设θ=inf{T≥ θLt>Ft}a.s.然后(Gθ,αθ),(Gθ,αθ)由αθi(t)定义=1如果Mt≥ Ftand t=inf{s≥ t | Ls>Fs},{Lt>Ft}Lt- FtLt- Mtelseforanyt∈ [θ, ∞) Gθi=1{t≥θ},i=1,2,是θ子对策中的一个平衡点。在离散时间内,可能存在同时停止的正概率均衡,即使这是最坏的结果,因为参与者只能为单个周期分配正概率;一个人无法通过在对手质点后停止任意小的时间ε>0来避免协调失败。参见Steg(2017),了解离散化优先购买模型和正式极限分析。在对称情况下,Riedel和Steg(2017)中命题3.1的当前扩展到非空集{M>F}是直接的。由此产生的收益为Vθi(Gθi,αθi,Gθj,αθj)=max(Fθ,Mθ)。备注7.2。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 14:06:22
当L>F时≥ M、 然后,αθi的选择使相应的其他p层在停止和等待之间有所不同,并且αθi(·)是正确连续的,允许极限结果论证。当M>F时,停止当然是唯一的最佳回复。在极性情况下Lt=Ft=Mt,可能没有1{Lt>Ft}Lt的右手极限-FtLt-Mt,所以我们设置αθi(t)=1。如果极限确实存在,那么它可以用来使αθi(·)即使在这里也是连续的,因为在这种情况下,层是不同的。如果Lθ=Fθ>Mθ,那么每个玩家都有可能成为领导者或追随者。这与富登堡和蒂罗尔(1985)的光滑确定性模型的结果相同。如果Lθ>Fθ>Mθ,那么同时停止的概率是正的,这是抢占的代价,将支付降低到Fθ。7.2一般对称平衡我们现在可以组合F的平衡≥ L或L>F。对于标准混合策略,定理5.1中(暂时)后动优势的均衡取决于“终端条件”Gθi(M)-F)≥ 0,例如,当一个先发制人机制开始时,两个参与者都试图立即停止。然而,命题7.1为我们提供了“持续”平衡,即在这种转变时立即停止,并支付最大值(F,M)。事实上,如果playerj使用扩展的混合策略,那么当Gθj在^τθj=inf{t处跳到1时,玩家i在s领先和等待之间的差距≥ θ|αθj(t)>0}从Gθj(M)- F)到GθjαθjM+1.- αθjL- F,如果αθjis如建议7.1所示,则为非负。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 14:06:25
因此,这种在抢占中进行部分协调的可能性也会在我们不能拥有M时为消耗机制生成合适的端点≥ 在到达{L>F}之前。因此,我们得到了一个支付对称子博弈完美均衡f或任何对称计时博弈,其中支付过程L、f和M不依赖于单个参与者。定理7.3。在假设2.1下,扩展混合策略(Gθ,αθ)存在一个支付对称的子博弈完美均衡;θ ∈ (Gθ,αθ);θ ∈ T)如下所示:选择i,j∈ {1,2},i6=j.对于任何θ∈ T,setτθ:=inf{T≥ θLt>Ft或Mt>Ft}。定义定理5.1中的Gθi,Gθjas和命题7.1中的αθi=αθjas。此外,如果L、F和M对于每个停止时间τ∈ T它认为lτ=Fτ=> 如果τ=Mτ或τ=inf{t>τ| Lt>Ft}a.s.,则存在一个对称的子博弈完美均衡,其中每个参与者的策略由(Gθi,αθi)给出∈ T那么,lim inf和lim sup in定义C.1都与命题7.1的策略有关。证据:见附录B.1。这些均衡的想法基本上是在{F}上粘贴消耗战≥ 五十} 利用定理5.1中的连续策略和命题7.1中的扩展混合策略在{L>F}上立即停止的抢占均衡。然而,我们必须为这样做做好准备,因为精确的磨损行为在很大程度上取决于连续性。当抢占开始时。根据假设2.1(iii)的上半连续性,在磨损期间,各层在未来的连续性平衡上与payoff s max(F,M)协调是可行的。那么,从开始先发制人开始,支付不会出现明显的下降。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 14:06:28
相应的对称性平衡结果由ESS supτ给出∈T:τ≥θEh{τ<τ}Lτ+1{τ≥τθ}max(Fτθ,Mτθ)Fθi,τθ=inf{t≥ θLt>Ft或Mt>Ft}∈ T而端点条件Gθi(M)-F)≥ τθ处的0现在被抢占继续平衡所取代,我们仍然需要确保第二个平衡,Gθi(M)- F)≤ τθi为0;强制执行第τθ章∧inf{t≥ Mt>Ft}在一般情况下有效,但在更具体的情况下也可能有其他选择。定理7.3的证明当然依赖于定理5的证明。1和P位置7.1。主要问题是前者是在一个简化的设置中用“标准”混合策略制定的,因此我们用扩展的混合策略建立了与当前设置的正式关系。8最优对称均衡定理7.3中的均衡涉及到最具攻击性的抢占,这是可以想象的——它出现在L>F的任何时候,并且仅适用于这个原因。因此,它们的结构相对简单:只要有严格的先发优势,游戏就开始。如果未来存在具有足够高(预期)收益的持续均衡,那么先占不必那么严重。在本节中,我们确定了具有最小可能先占的均衡,从而产生了最高可满足的均衡收益。我们关注的是一类收益-对称均衡,即在任何停止时间Vθ=Vθa.s.的su bgame完美均衡∈ T这些对均衡策略有着明确的影响。在竞争性游戏中,当M是最低的支付时,均衡支付最多是最优停止最小值(L,F)——无论玩家如何混合,可能使用公共关联(命题8.1)。这种均衡支付的边界使我们能够确定不可避免的优先购买点:当领先支付超过任何持续均衡支付时。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 14:06:34
定理8.2建立了相应的galgorithm,并证明了“最优”子博弈完美均衡的存在性。很明显,如果M不是更好,在{F>L}上的任何停止都必须导致更低的支付。我们论点的基础是一个更微妙的结果,即玩家也不能通过在任何支付对称均衡中混合来利用F,即使他们没有时间限制。8.1号提案。假设M≤ 我在(L,F)。然后,在任何支付对称子游戏perfec龙舌兰酒和任何θ∈ T和我,j∈ {1,2},其中i6=j,VθiGθi,αθi,Gθj,αθj≤ ess supτ∈T:τ≥θELτ∧ FτFθ=: UL∧F(θ),其中实际上足以考虑停止时间τ≤ inf{t≥ θGθi(t)∨ Gθj(t)≥ 1}.附录B.2中命题8.1的p屋顶基于任何支付的重要事实——对称均衡(不依赖于假设M≤ min(L,F):首先,玩家的条件停止概率必须与{F 6=L}(引理B.2)上的相同,因为以较高条件概率停止的玩家也会以较高条件概率成为领先者,而另一个玩家则会成为该事件的跟随者。作为一个结果,Gθ和Gθ在{F=L}(引理B.3)上施加任何质量之前必须是相同的。此外,在{F6=L}上,只能同时跳转,并且只有当M≥ F或当L发生抢占时≥ F>M。最重要的是,当F>max(L,M)时,不会有任何跳跃。最后,来自任何终端jum p的局部支付由max(F,M)(引理B.4)约束。命题8.1的直觉如下。在平衡状态下,玩家我必须耐心等待,直到Gθi<1的任何时刻,然后在相应的条件概率下从那里停止。将第一个玩家在{F上施加质量的时间视为这样一个时间≥ 五十} );称之为∧τ。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 14:06:37
通过等待)τ,如果Gθjin增加,那么玩家i可能在{F<L}之前成为跟随者。至少有一个玩家愿意通过定义来超越。相应的(对称的)局部支付显然是Lτ≤ 当Gθ,Gθ是连续的时,F∧τ。只有当F)τ=L)τ时,才会发生跳跃,这也是最大的局部支付(假设为M≤ min(L,F),如我们所见,当F)τ>L)τ时,我们不能有任何跳跃。最后,Gθiis可能在{F<L}上耗尽,在到达θτ之前。然而,我们必须有Gθ=Gθ。如果跳转到1,则终端支付为atmost F<L;如果他们不断接近一个,这意味着最终肯定会成为{F<L}的追随者。总之,当停止发生时,玩家i从未收到超过分钟(L,F)的奖励。命题8.1意味着只要Lθ>UL∧F(θ),我们必须有G(θ)∨ Gθ(θ)=1优先购买权。如果未来有任何这样的抢占点,它们也会限制可行的停止时间τ,以最大化位置8.1中min(L,F)的预期值,该参数不会受到任何跳跃的影响Gθj(θ)∈ (0,1)由于哪个球员,我无法实现Lθ。L是连续的,所以我可以试着在θ之后停下来。形式上的论证见第8.2条的证明。这甚至进一步降低了最大可达到的平衡收益。通过迭代,我们可以确定什么时候先发制人是不可避免的。定理8.2。Su-ppose M≤ min(L,F)。然后,在这个类中存在一个支付-对称的子博弈完美均衡,其支付最大。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 14:06:41
对任何人来说θ∈ T,这些是VθGθ,αθ,Gθ,αθ= VθGθ,αθ,Gθ,αθ= ess supτ∈T:τ∈[θ,θτ(θ)]ELτ∧ FτFθ=: U(L)∧F)τ(θ)(θ),其中τ(θ)是通过以下算法确定的最新可持续抢占点:(i)集τ(θ):=inf{t≥ θLt>UL∧F(t)}和(L)∧ F)τ(θ):=书信电报∧τ(θ)∧ 英尺∧τ(θ)T≥0带有Snell信封U(L∧F)τ(θ):=(ess supt)≤τ∈TE[(L∧ F)τ(θ)τ| Ft])t≥0.(ii)每n∈ N、 集合τN(θ):=inf{t≥ θLt>U(L∧F)τn-1(θ)(t)}∧ τn-1(θ)和(L)∧ F)τn(θ):=书信电报∧τn(θ)∧ 英尺∧τn(θ)T≥0带有Snell信封U(L∧F)τn(θ)=(ess supt)≤τ∈TE[(L∧ F)τn(θ)τ| Ft])t≥0.(iii)取单调极限∧τ(θ):=limn→∞τn(θ)。证据:见附录B.3。使用定理7.3中的策略实现支付-最大平衡,但在∧τ(θ)之前设置αθi=0。从技术上讲,用该算法构造∧τ(θ)并不困难。主要问题在于验证所声称的均衡性质:为了确保当L>F在[θ,θτ(θ))上时,不存在抢占激励,在θτ(θ)处确实是最大的,并且在θτ(θ)处存在抢占的持续均衡此外,可测量性是一个主要的技术问题,因为我们希望有一个时间一致的策略版本,在这里我们为所有的策略设置αθi=0∈ 在所有UBS游戏中实现最大回报。为了在Lθ>Fθ时抑制抢占,存在τ显然是不够的≥ θ使得E[Lτ∧ Fτ| Fθ]≥ Lθ;因此,这种关系必须保持[θ,τ]∩ {L>F}。例如,通过目视检查,T heorem 8.2的算法可以应用于Fu denberg和Tirole(1985)的模型,如图1所示。L在τ处首次超过了未来最大值min(L,F),因此将出现抢占。考虑到这一点,几乎可以实现最小(L,F)到τ的最大值。然而,在τ处,L也将超过这个红色的值。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 14:06:45
在极限状态下,τ(0)=满足第一个不可避免的抢占点。Fudenberg和Tirole还考虑了另一种情况,案例B,intLFML,F,MTτt图1:先占,Fudenberg和Tirole(1985),其峰值高于第一个。那么∧τ(0)=∞, 因为L=F是从全球巅峰开始的,玩家可以在联合后期采用上进行协调。总的来说,我们可能会有更复杂的随机模式,当然,具有任意区域的后发优势,这可能会触发先发制人或不触发先发制人。9结论在许多计时游戏中,正如我们所说,混合策略起着重要作用,无论是平衡的存在,还是解决游戏中的任何战略冲突(关于具有不同便利设施的角色)。在分析了两种不同的局部战略激励之后,我们已经能够证明一般对称随机时间博弈的子博弈完美均衡的存在性,并明确地刻画了它们的特征,提供对称均衡。我们的方法基于最优停止的一般理论,并说明需要解决哪类停止问题来验证均衡;不仅如此,尤其是混合策略。对于一个给定的时间博弈,可能存在不同的均衡,不同的优先度。我们考虑了两种极端情况:如果一方在有先发优势时发起先发制人,那么支付可能会受到严格限制。然而,我们已经展示了如何将优先购买权降至最低,并证明了相应均衡的存在性和最大可实现的收益。如果在一个具有先发优势的特定制度下(通过有效的未来持续均衡),确实可以防止优先购买,那么在连续混合中也可能存在进一步的均衡,我们只是为了后发优势才使用它。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 14:06:48
然而,任何此类额外的混合都将是有效的,并导致较低的回报(也可以直接显示)。Steg和Thijssen(2015)分析了一个更具体的战略投资模型,该模型具有随机性和后动优势,其中与本文所述战略相对应的战略具有马尔可夫表示。A技术成果引理A.1。如果L是(D)类的(可测)过程,则存在常数K∈ R+使得对于任意过程G,它是a.s.右连续的,非减量的,非负的,并且有一些G的界∞∈ L∞(P)对于任何[0,∞]-有值随机变量a,b它认为(i)EZ[a,b)| Lt | dGt≤ KkG∞K∞< ∞ 和(ii)Z[a,b)| Lt | dGt=Z∞LτG(x){τG(x)∈[a,b)}dx<∞ a、 其中τG(x):=inf{t≥ 0 | Gt≥ x} 对于任何x∈ R+,和G:=G。如果τG(x)被定义为“Gt>x”,则同样适用。如果G上的界是唯一可积的,即G∞∈ L(P),但{Lτ{1τ<∞}| τ ∈ T}界于L∞(P)由K∈ R+,然后(i)与KE[G]保持一致∞] 取而代之的是(ii)如上所述。证据a.s.非减量停止时间族(τG(x))x∈R+是G的左连续逆,满足τG(x)≤ T<=> 燃气轮机≥ x、 因此,对于约定的R[0,c]dG=Gc,我们有a.s.R[0,∞)AdG=R∞{τG(x)∈A} 阿拉的dx∈ {[0,c]|c∈ R+}以及A=R+的单调收敛。该关系通过单调类参数从R+扩展到所有Borel集A。As L·(ω):R+→ R、 t 7→ Lt(ω),与函数1{t一样是Borel可测的∈[a(ω),b(ω))},我们由此得到变量公式Z[a,b)| Lt | dGt=Z{τG(x)的变化<∞}LτG(x){τG(x)∈[a,b)}dx=Z∞LτG(x){τG(x)∈[a,b)}dx a.s.这个公式也适用于inf{t≥ 0 | Gt>x}=τG(x+)而不是τG(x),因为这两个变量只能影响一组勒贝格测度(dx)0。根据富比尼定理,EZ∞LτG(x){τG(x)∈[a,b)}dx≤Z∞嗯LτG(x){τG(x)<∞}idx=ZkG∞K∞嗯LτG(x){τG(x)<∞}idx。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 14:06:51
(A.1)由于L属于(D)类,{Lτ{1τ<∞}| τ ∈ T}在L(P)中被一些K<∞, 其中(A.1)以KkG为界∞K∞如果后者是有限的。如果kLτ{τ<∞}K∞≤ K表示每τ∈ TSee,例如,Kallenberg(2002),定理1.1。例如,参见Kallenberg(2002),引理1.26(i)。例如,参见Kallenberg(2002),引理1.22。有必要将dx限制为{τG(x)<∞}, 当积分到[a,b]上时,它是冗余的,而G是以G为界的∞∈ L(P),那么(A.1)以z为界∞EhK1{τG(x)<∞}idx=KEZ∞{τG(x)<∞}dx≤ KE[G]∞] < ∞.在这两种情况下,它都遵循R[a,b)| Lt | dGt<∞ a、 s.引理a.2。假设过程L、F和M是可选的,属于(D)类,而适应的过程G是右连续的、不减损的,并且取[0,1]a.s.中的值。那么由t定义的Sde:=Z[0,t)FsdGs+GtMt+1.- 燃气轮机中尉,t∈ R+是可选的,也属于(D)类。此外,如果另外∞∈ L(P)和G∞≡ 1个定义,相应地∞通过设置t=∞, 然后也是S∞∈ L(P)。证据S的分量显然是可选的,尤其是积分是左连续的,且G右连续和左连续适应过程的差异。证明S在假设下属于(D)类,并且S∞∈ L(P),足够清楚地证明{R[0,τ)F dG |τ∈ T}是一致可积的。根据d e laVallée-Poussin定理,一类随机变量{Xτ|τ∈ T}是一致可积的当且仅当存在一个非减量凸函数g:R时+→ R+如此有限→∞g(t)t=∞和supτ∈TE[g(|Xτ|)]∞. 通过{Fτ{τ的假设,这一点成立<∞}| τ ∈ T};参见fn。10.修复与F相关的g。通过变量的变化,如引理a.1,然后SUPτ∈TEGZ[0,τ)FsdGs≤ supτ∈TEGZFτG(x){τG(x)<τ}dx≤ supτ∈TEZgFτG(x){τG(x)<∞}dx≤Zsupτ∈泰格Fτ{τ<∞}idx<∞.对于最后两个不等式,我们分别。使用了Jensen不等式和Fub-ini定理。引理A.3。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 14:06:54
考虑两次停车时间≤ τ和一个事件C∈ Fσ。然后θ:=σ1C+τ1C表示停止时间。如果过滤完成,则表明σ≤ τa.s.证明。为了验证θ是停止时间,我们检查{θ≤ t}∈ 全速飞行∈ R+。首先请注意{θ≤ t} =({σ)≤ t}∩ C)∪ ({τ ≤ t}∩ Cc)。F-s-t相交属于Fσ的定义,因此也属于补码({σ≤t}∩ C) C={σ>t}∪ 复写的副本∈ Ft,意味着Cc∩ {σ ≤ t}∈ 最后,作为{τ≤ t}∈ 英国《金融时报》∩ {σ ≤ t}∩ {τ ≤ t} =Cc∩ {τ ≤ t}∈ Ft.Ifσ≤ τ仅为a.s.,则最后一个等式适用于空集Cc∩ {σ>t}∩ {τ ≤ t} ,如果过滤完成,则包含在FTI中。引理A.4。过程Lτθ:=1{t<τθL}L+1{t≥τθmax(Fτθ,Mτθ)在理论5中定义。1在[θ]上从左上半连续,∞], 在这一点上,DLis henceleft连续a.s.证明。设(τn)n∈Nbe停止时间的顺序,即a.s.增加并获取价值[θ,∞], 用τ表示极限∈ T定义可测量集:=\\n{τn<τθ}。然后limn→∞~Lτn=~Lτa.s.在Ac上,意味着limn→∞E[1AcLτn]=E[1AcLτ],因为L属于(D)类。我们得到了L的类似物∧如果我们使用(τn∧τθ)和(τ)∧τθ),分别。将后一个f作用与假设2给出的期望中的左上半连续性相结合。1(iii)yieldslim supn∈氖A(L)∧ F)τn∧τθ+1Ac(L∧ F)τn∧τθ≤ EA(L)∧ F)τ∧τθ+1Ac(L∧ F)τ∧τθ=> 林尚∈氖A(L)∧ F)τn≤ EA(L)∧ F)τ.注意(L)∧ F)τn=~Lτ非A和(L)∧ F)τ≤~Lτ在A上 {τ ≤ τθ},暗示着目标。最后,我们证明了如果L在区间[θ]上是左上半连续的,∞], 然后,在这段时间间隔内,DLare的路径保持连续,即a.s。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 14:06:58
用Lt定义辅助过程^L:=1{t<θ}Mt+1{t≥θ}Lt,其中^M是M artingale(E[~Lθ|Ft])t的右连续版本≥0,由于可选采样,它是一致可积的,因此(左)连续不可预测。^L从左不可测继承上半连续性,因为E[^Lτn]=E[1{τn<θ}Lθ+1{τn≥θ}Lτn]=E[~Lτn∨θ]和类似的E[^Lτ]=E[~Lτ∨θ]. 正如▄L和▄L同意的那样,∞], 他们的斯内尔在这段时间内的任何一个停顿时间都会包围着U!Land U^Lagree,因此U!≥θ}和U^L{t≥θ}是无法区分的唯一可选投影。同样的情况也适用于补偿装置DLand D^Lon[θ,∞] Doob-Meyer-d生态组合的独特性。D^Lis左连续a.s.因为^L是期望中的左上半连续,参见f n.28。引理A.5。让A,B:R+→ R∪ {+∞} 是两个右连续且不减损的函数,其值为0≤ B≤ 1.然后微分方程dg=(1)- G) dA,G0-= A.∈ R(A.2)的解g=1- (1 - a) e-RdAcQ(1+(A)-1= 1 - (1 - a) e-RdAc-兹罗提(1)+A) ,式中Ac=A-PA.∈ [A,A]是A的连续部分,微分方程dg=(1)- G-) dB,G0-= B∈ R(A.3)的解g=1- (1 - b) e-RdBcQ(1)- B) =1- (1 - b) e-RdBc+Pln(1)-B) 。(A.2)或(A.3)的任何解对一是单调的,但决不交叉。G解这两个方程的当且仅当A=地下一层-B、 re sp。B=A1+A.证据。检查起来很简单。注意dG=(1-a) dA1+对于(A.2)的任何解,这意味着一个的两边都是单调的,并且这个值不能交叉。的确,G 1.<=> G 1.- G0-= 1.- A.<=> 0 1.- a、 类似地,dG=(1- b) 对于(A.3)的任何解,意味着G 1.<=> G1.- G0-= 1.- B<=> 0 1.- b和B<1,使用B∈ [0,1]表示最后一个等价项。引理A.6。让(Yt,Zt)t∈[0,1]是一个随机变量族。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 14:07:01
假设族(Yt)是一致可积的,族(Zt)在L中有界∞(P)和Zt→ 0的概率为t→ 1.Thenlimt→1E[YtZt]=0。证据(kZtk)∞) 在L(P)中,h en ce(Zt)是一致可积的,并且收敛到常数零,即t→ 1.由于(Yt)是一致可积的,我们可以为任何ε>0找到一个合适的常数Kε≥ 0这样的{| Yt|≥Kε}YtZt|≤ εK表示所有t∈ [0, 1].总之,lim supt→1E|YtZt|= 林监督→1.E{| Yt|≥Kε}YtZt|+ E{| Yt |<Kε}| YtZt|≤ 林监督→1E{| Yt|≥Kε}YtZt|+ 极限→1E{| Yt |<Kε}| YtZt|≤ εk索赔如下。B.证明某人。1第3-7节中结果的证明引理的证明3.1。通过停止时间τG,θi(x):=inf{t确定Gθib的右连续逆≥ θGθi(t)>x},x∈ [0,1)。引理A.1允许变量Z的变化[θ,∞)Sθi(t)dGθi(t)=ZSθiτG,θi(x){τG,θi(x)<∞}此外,x>Gθi(∞-) => τG,θi(x)=∞ => 十、≥ θi(∞-), i、 e.,1{x>Gθi(∞-)}≤ 1{τG,θi(x)=∞}≤{x≥θi(∞-)}为了所有的x∈ [0,1]a.s.,暗示θi(∞)Sθi(∞) =Z{τG,θi(x)=∞}dxSθi(∞) a、 因此,VθiGθi,Gθj= EZSθiτG,θi(x){τG,θi(x)<∞}dx+ZSθi(∞)1{τG,θi(x)=∞}dxFθ= EZSθiτG,θi(x)dxFθ. (B.1)将(B.1)超过ess supx的事件记录下来∈[0,1)E[Sθi(τG,θi(x))|Fθ]=:Zθian,通过矛盾P[A]>0进行假设。然后E[1ARSθi(τG,θi(x))dx]>E[1AZθi]通过A∈ Fθ并用Fubini定理消除期望,soRE[1ASθi(τG,θi(x))]dx>E[1AZθi]。因此就存在x∈ (0,1)带有E[1AZθi]<E[1ASθi(τG,θi(x))=E[1AE[Sθi(τG,θi(x))|Fθ]],这与Zθi相矛盾≥ E[Sθi(τG,θi(x))|Fθ]。那么,Vθi(Gθi,Gθj)≤ Zθia。s、 ,暗示(3.3)。考虑到后者并用UθSi表示其右侧,它是a.s.约束当且仅当ifE[Vθi(Gθi,Gθj)]=E[UθSi],即by(B.1)和Fubini,当且仅当ifRE[sθi(τG,θi(x))]dx=E[UθSi]。Sθi(τG,θi(x))=UθSia。s、 对于a.e。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 14:07:05
十、∈ [0,1).如果Gθiis被任何可行的αθiii扩展,而不是平凡的α∞由1{t给出≥∞}, 那么就很容易从定义2.5和C.1中检查VθiGθi,αθi,Gθj,α∞- VθiGθi,α∞, Gθj,α∞= 呃{^τθi<∞}θi^τθiGθj^τθi1.- αθi^τθiF^τθi- M^τθiFθiwith^τi=inf{t≥ 0 |αθi(t)>0},所以Gθi(^τθi)=1。设B={1{^τθi<∞}Gθj(^τθi)(F^τθi)- M^τi)>0},所以B∈ F^τθi,以及任何n的定义Gθ∈ N\\{1,2}通过延迟Gθi(^τθi)到^τθi+n-1onB,即通过Gθn(t)=Gθi(t)1{t<tθτθi}+(Gθi(^τθi-)1B+1Bc)1{t-^τθi∈[0,n-1) }+1{t≥^τi+n-1}. 然后(Gθn,α∞) 是一种可行的(标准的)混合策略。让我们来看看C∈ Fθ。通过L和Gθj,Sθi(t+)的右连续性- Sθi(t)=Gθj(t)(英尺)- Mt)。作为(D)类的SθII,我们得到了期望极限→∞EhCVθiGθn,α∞, Gθj,α∞- VθiGθi,α∞, Gθj,α∞i=limn→∞ECZ[0,∞]Sθi(t)dGθn(t)-Z[0,∞]Sθi(t)dGθi(t)= EhCSθi(^τi+)- Sθi(^τθi)BGθi(^τθi)i=EhCGθj^τθiF^τθi- M^τθiBθi^τθi我≥ EhCVθiGθi,αθi,Gθj,α∞- VθiGθi,α∞, Gθj,α∞i、 与所有对(Gθn,Gθj)的(3.3)一起,这表明C={Vθi(Gθi,αθi,Gθj,α∞) >ess supτ≥ θE[Sθi(τ)|Fθ]}的概率必须为零。引理4.1的证明。通过L和Gθj的右连续性,Sθi(τ+)- Sθi(τ)=Gθj(τ)(Fτ)-Mτ)≥ 0表示任意τ∈ T现在考虑集合{τi<τ*L(θ)},a.s.EhSθiτ*L(θ)+- SθiτiFτii=EZ[τi,τ*L(θ)]FsdGθj(s)+1.- Gθjτ*L(θ)Lτ*L(θ)- Gθj(τi)Mτi-1.- GθjτiLτiFτi≥ EhFτ*L(θ)Gθjτ*L(θ)- Gθjτi-+1.- Gθjτ*L(θ)Lτ*L(θ)-1.- Gθjτi-LτiFτii≥ 弹流润滑τ*L(θ)1.- Gθjτi--1.- Gθjτi-LτiFτii≥ 0.第一个不等式是通过变量的变化得出的,即F是一个超鞅(在证明末尾演示),而L≥ M第二个不平等是由于≥ 最后一个是关于τ的最优性*L(θ)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 14:07:09
注:如果P[τi<τ,则后者将是严格的*L(θ)和Gθj(τi)-) < 1] >0,通过任何θ的次优性≤ τi<τ*L(θ)。引理4.1中的第二个估计遵循前面步骤中设置的τi=θ。下一个说法是由于τ的期望值被忽略*L(θ)≥ θ和E[Sθi(τi+)|Fτ*L(θ)]≤ ess supτ≥ τ*L(θ)E[Sθi(τ)|Fτ*L(θ)]对于任何s打顶时间τi≥ τ*L(θ)。事实上,让我们∈ Fτ*L(θ)是指在给定的τi内,后一个发生故障的事件,并考虑停止时间τi+n-1,n∈ N.作为(D)类的Sθii,E[1ASθi(τi+)]=limn→∞E[1ASθi(τi+n)-1)] ≤ E[1应力supτ≥ τ*L(θ)E[Sθi(τ)|Fτ*L(θ)],表明A的概率为零。最后,前面和后面的步骤与τ相同*L(θ)替换为τ**L(θ)。与引理3.1的证明类似,变量变元的注释性变化是EHFτ*L(θ)Gθjτ*L(θ)- Gθjτi-Fτii- EZ[τi,τ*L(θ)]FsdGθj(s)Fτi= EZFτ*L(θ)- FτG,θj(x){τG,θj(x)∈[τi,τ*L(θ)}dxFτi不能超过ess supτ≥ τiE[(Fτ)*L(θ)- Fτ)1{τ∈[τi,τ*L(θ)}| Fτi]。通过在τ处用E[(Fτ)迭代预期,这是非正的*L(θ)-Fτ)| Fτ]≤ {τ上的0≤ τ*L(θ)}因为F是一个超鞅。命题4.2的证明。让θ∈ T和C∈ Fτ*L(θ)。然后τ*, τ*根据假设,由于τ的引理A.3,达到了最佳时间*L(θ)≤ τF(θ)a.s.验证τ的最优性*, 它由引理3.1和4.1考虑从τ停止Sθ*L(θ)打开。关于C,Sθ(t)=Lt∧τF(θ)对所有t≥ τ*L(θ),使得在τ处立即停止*L(θ)通过其对L的最优性是最优的。关于Cc,Sθ(t)=Fτ*L(θ)≥ Mτ*L(θ)表示所有t>τ*L(θ),在{τF(θ)=τ上相等*L(θ)}假设。因此,τF(θ)在Cc上是最优的。s-ame参数适用于τ*, 交换Cand和Cc。我们可以使用τF(θ):=inf{t≥ θFt=Mt}因为τF(θ)≥ τ*L(θ)a.s.事实上,由于Fis是一个支配L的超级艺术家,它也支配着斯奈尔信封。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 14:07:13
因此,在τF(θ)处,F=M(通过右连续性)意味着F≥ UL≥ L≥ 我必须自始至终坚持下去。因此,τF(θ)≥ inf{t≥ θUL(t)=Lt}=τ*L(θ)。定理5.1的证明。让θ,τθ∈ 这不是假设。由于它们是固定的,在这个证明中,我们可以将它们作为上标(除了τθ)进行抑制,以便于可读性。L是右连续的a.s.且属于(D)类,因此它有一个斯奈尔包络UL,其上有一个可积和可预测的补偿器DL,∞],预计L从左边开始是上半连续的,然后D是a.s.连续的;参见引理A.4和参考fn。28,29。现在让我们来看看Gi,Gjerp。由(5.1)、(5.2)给出。GIRE呈现了一种标准的混合策略:它被改编为τi∈ 它是a.s.右连续的,不减损的,有Gi(T)=0∈ [0,θ)和Gi(∞) = 1.它只能在τi处跳跃≤ τ:1{F>L}(F- L)-1可以被理解为Radon Nikody m衍生物,因此,积分定义了R+上的一个测度,它是绝对连续的w.R.t.(有限)无原子测度dDL.Gj甚至在[θ,τ]上是连续的。为了证明由Gj表示的标准混合策略是对Gi(即使在扩展的混合策略中)的最佳回答,它利用引理3.1及其证明证明,对于某些随机变量,每个停止时间τ≥ θ我们有ehsj(τ)费伊≤ 呃¨Zj如果dGj(τ)>0,则Fθi(B.2)相等。实际上,那么ess supτ≥ θE[Sj(τ)|Fθ]≤ E[\'Zj|Fθ],然后通过等式,它在(B.1)下的论点中成立,即E[Sj(τG,θj(x))|Fθ]=E[\'Zj|Fθ]=:Zj代表所有x∈ [0,1),所以它也适用于所有的不等式反转(p[A]>0除外),因此表明Vj(Gj,Gi)=Zj=E[\'Zj|Fθ]。新的测量值也是σ-fine,即{F>L}=Sn∈N{F- L≥n} 。为了建立(B.2),考虑任意停止时间τ≥ θ. 首先假设τ≤ τi.在[θ,τi]上,GISATIES dGi=(1)- Gi)(F)- L)-1{F>L}dDLby构造,和1{F≤五十} 通过定义τi,dDL=0。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 14:07:16
因此,Z[θ,τ)(F)- 五十) dGi=Z[θ,τ)(1)- Gi)1{F>L}dD@L=Z[θ,τ)(1)- Gi)dDLa。s、 ,(B.3)其中,由引理A.1和(D)类的引理L定义的DGII。将部件积分应用到右侧(调整[θ,τ)左侧闭合,右侧打开,并重新校准DLis连续)yieldsZ[θ,τ)(1- Gi)dDL=Z[θ,τ)DLdGi+1.- Gi(τ)-)DL(τ)-1.- Gi(θ-)DL(θ)。(B.4)使用(B.3)、(B.4)和Gi(θ)-) = 0,nowSj(τ)=Z[θ,τ)F dGi+Gi(τ)Mτ+1.- Gi(τ)Lτ=Z[θ,τ)L+DLdGi+Gi(τ)Mτ+DL(τ)+1.- Gi(τ)Lτ+DL(τ)- DL(θ)。接下来,由于斯奈尔包络的鞅分量MLof是一致可积的,所以RMldgi由引理A.1定义得很好,我们可以将变量的变化转化为Z[θ,τ)M~LdGiFθ= EhM~L(τ)Gi(τ)-) - Gi(θ-)Fθi=- EhM~L(τ)1.- Gi(τ)-)Fθi+MθL(θ)1.- Gi(θ-)就像M~Lis是鞅一样。事实上,与引理3.1的证明类似,EZ[θ,τ)ML(t)dGi(t)Fθ- EhM~L(τ)Gi(τ)-) - Gi(θ-)Fθi=EZMLτGi(x)- M~L(τ){τGi(x)∈[θ,τ)}dxFθ不能超过ess supτ′≥θE[(M~L(τ′)-M~L(τ))1{τ′∈[θ,τ)}Fθ,通过在τ′处迭代期望值,其为零,带有E[(M~L(τ′)- 由于鞅性质,在{τ′<τ}上M L(τ))|Fτ′]=0。然后,切换符号会产生之前声明的身份。将最后两个结果与Gi(θ)相结合-) = 0,ESj(τ)Fθ= EZ[θ,τ)L+DL- MLdGi+Gi(τ)Mτ+DL(τ)- M~L(τ)(B.5)+1.- Gi(τ)Lτ+DL(τ)- M~L(τ)Fθ- L(θ)+M(θ)。关于[θ,τ),L+DL- M~L=~L- ULbyτ≤ τi≤ τθ,因此积分消失。事实上,dgis是绝对连续的w。r、 t.dD)Lon[θ,τi),andR(U)L-~L)dD~L=0;参见(3.7)。福瑟莫尔,在{τ<τi}上,Gi(τ)=0,在{τ=τi}上,UL(τ)=Lτ。具体地说,在{τi<τθ}上,它们的定义意味着τi处的1{F=L}dD@L>0,因此U@L(τi)=Lτi=Lτi=Lτi=Fτi;参见(3.6)。在{τi=τθ}上,U?L(τi)=?Lτias?Ltis常数f或t∈ [τθ, ∞].
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 14:07:21
最后,当τ时,期望中的最后一项消失≥ τθ,否则又有Lτ=~Lτ。(B.5)因此Sj(τ)Fθ= Eh{τ=τi}Gi(τi)Mτi-Lτi+1.- Gi(τ)~Lτ- UL(τ)Fθi+UθL(θ)≤ Eh{τ=τi}Gi(τi)Mτi-LτiFθi+UθL(B.6)由UθL≥L,等于τ=τiby U@L(τi)=Lτi(分别为dGj(τ)>0,因为τ=inf{t≥ 在{τ<τi}上的τ| D@L(t)>D@L(τ)};参见(3.6)。现在我们移除限制τ≤ τiby是一个估计值。Sj(t)对t是常数∈ (τi,∞], 带Sj(t)- Sj(τi)=Gi(τi)(Fτi)-Mτi)。因此,Sj(τ)≤ Sj(τi)+Gi(τi)(max(Fτi,Mτi)- Mτi)在{τ>τi}上。这个估计也适用于{τ=τi},所以对于任何停止时间τ≥ θ我们与(B.6)一起Sj(τ)Fθ= EhSj(τ)∧ τi)+1{τ>τi}Gi(τi)Fτi- Mτi费伊≤ EhSj(τ)∧ τi)+1{τ≥τi}Gi(τi)最大值(Fτi,Mτi)- Mτi费伊≤ Eh{τ∧τi=τi}Gi(τi)Mτi-Lτi+ 1{τ≥τi}Gi(τi)最大值(Fτi,Mτi)- MτiFθi+UθL(θ)=Eh{τ≥τi}Gi(τi)最大值(Fτi,Mτi)-LτiFθi+UθL(θ)。(B.7)回想一下)Lτθ=max(Fτθ,Mτθ),正如刚刚观察到的,U)L(τi)=Lτi=Lτi=Fτ离子{τi<τi}。因此,我们可以总结(B.7)asESj(τ)Fθ≤ Eh{τ≥τi}{τi<τθ}Gi(τi)最大值(Fτi,Mτi)- FτiFθi+UθL(θ)≤ Eh{τi<τθ}Gi(τi)最大值(Fτi,Mτi)- FτiFθi+UθL(θ)。(B.8)这是一个τ独立的界。构造一个停止时间τa≥ θ实现了这一点,letC={Gi(τi)(Fτi)- Mτi)>0},所以C∈ Fτi,我们可以定义τa=τ离子c和τa=∞ onC;参见引理A.3。注意,τi<τaon C由约定F决定∞= M∞. 然后Sj(τa)=Sj(τi)+1CGi(τi)Fτi- Mτi= Sj(τi)+Gi(τi)最大值(Fτi,Mτi)- Mτi因此,我们对Sj(τ)的估计对τ=τa具有约束力,因此也是(B.7)中的第一个不等式。第二个是绑定,因为它代表τ=τa的(B.6)∧ τi=τi。因此,(B.8)中的第一个等式是结合的,最后第二个等式是τa≥ τi。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 14:07:25
这意味着Gj是对Giif的最佳回复,并且只有当Vj(Gj,Gi)=E[RSjdGj|Fθ]=E[Sj(τa)|Fθ]时。为了将其降低到索赔条件,我们可以使用(B.6)-(B.8)如下。总之τ≥ θ:ESj(τa)Fθ= ESj(τ)+Sj(τa)- Sj(τ)∧ τi)- 1{τ>τi}Sj(τ)- Sj(τi)Fθ= EhSj(τ)+1{τi<τθ}Gi(τi)最大值(Fτi,Mτi)- Fτi- 1{τ∧τi=τi}Gi(τi)Mτi-Lτi-1.- Gi(τ)∧ τi)~Lτ∧τi- UL(τ)∧ τi)- 1{τ>τi}Gi(τi)Fτi- MτiFθi.左手边与τ无关,因此通过(B.1)后面的参数。(B.2)我们可以用dGj(t)在右侧的期望值内进行积分,用t代替τ,从而得到Z[0,∞]Sj(t)dGj(t)+Z[0,∞]{τi<τθ}Gi(τi)最大值(Fτi,Mτi)- FτidGj(t)-Z[0,∞]{t∧τi=τi}Gi(τi)Mτi-LτidGj(t)-Z[0,∞]1.- Gi(t)∧ τi)~Lt∧τi- UL(t)∧ τi)dGj(t)-Z[0,∞]{t>τi}Gi(τi)Fτi- MτidGj(t)Fθ.当dGjis绝对连续w.r.t.dD@Lon[0,τi)和u@L(τi)=@Lτi(分别为as(B.6)在dGj(τ)>0时结合时,第四个积分再次消失Sj(τa)Fθ- EZ[0,∞]Sj(t)dGj(t)Fθ= Eh{τi<τθ}Gi(τi)最大值(Fτi,Mτi)- Fτi-1.- Gj(τi)-)Gi(τi)Mτi-Lτi-1.- Gj(τi)Gi(τi)Fτi- MτiFθi=Eh{τi<τθ}Gi(τi)最大值(Fτi,Mτi)- Fτi+ Gj(τi)Gi(τθ)最大值(Fτθ,Mτθ)- MτθFθi,其中最后一步从Gj(τθ)=1开始,定义@Lτθ,以及定义{τi<τθ},Gj(τi)=0,并且Gi(τi)>0,仅当Lτi=Lτi=Fτi。当且仅当a.s。Gi(τi)(Mτi)-Fτi)≤ {τi<τθ}上的0和Gi(τθ)(Mτθ)- Fτθ)≥ 0,没关系Gi(τθ)>0意味着τi=τθ和Gj(τθ)=Gi(τθ)。在这种情况下,在(B.8)和thusofvj(Gj,Gi)=E[RSjdGj | Fθ]=E[Sj(τa)| Fθ中建立的界的值变成了简单的U@L(θ)。前面的参数也用于显示GI何时是Gj的最佳代表,但分两步进行。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 14:07:29
GJ也满足dGj=(1-Gj)(F)-L)-1{F>L}dD@Lon[θ,τi),但可能Gj(τi)<1。然而,(B.6)仅在τi处使用U@L=@L,因此我们得到了切换角色的U@L,并且仍然τ≤ τi.由于Si(t)不必为t的常数,现在必须逐步消除该限制∈ (τi,∞]关于{τi<τθ}。因此,与C和τa类似,设D={Gj(τi)(Fτi)- Mτi)>0}∈ Fτi和τb∈ T满足τb=τ离子dC和τb=∞ 否则,τb>τ仅在{τi=τθ}上Gj(τi)=0。假设τ≤ τba。s、 在{τi=τθ}上τ>τ,其中Si(t)变为常数,因此估计值f或Sj(τ)也适用于切换角色,导致j和每个τ的(B.8)≤ τb.现在τ控制着界,它由1{τi<τθ}变成了μL(θ)Gj(τi)=0。Asτb≥ τi,R[0,∞](·)dGi=R[0,τb](·)dGi,因此Vi(Gi,Gj)=E[Si(τb)| Fθ]通过切换角色当且仅当E[Gi(τθ)Gj(τθ)(最大值(Fτθ,Mτθ)-Mτθ)|Fθ]消失,即当且仅当Gi(τθ)(Mτθ)- Fτθ)≥ 0 a.s.然后也是Vi(Gi,Gj)=U@L(θ)。证明E[Si(τb)|Fθ]≥ E[Si(τ)|Fθ]对于任何τ≥ θ,我们现在从τ开始≤ τθ然后得到一个不等式,而不是(B.3)中的第二个不等式,如1{F>L}(1)- Gj)dD~L≤(1 - Gj)dD不需要在{τ>τi}上绑定。然而,继续这个不等式,我们可以对转换角色应用后续步骤,并用τθ代替τi,得到(B.8)的类似物,表明实际上E[Si(τ)|Fθ]≤ 对于每个τ,UL(θ)≥ θ.用于GJ的论点表明,GI是对自身的最佳回答,当且仅当ifEh{τi<τθ}Gi(τi)最大值(Fτi,Mτi)- Fτi+Gi(τi)Lτi- MτiFθi=0<=> Eh{τi<τθ}Gi(τi)(1 - Gi(τi))(Mτi- Fτi)++Gi(τi)(Fτi)- Mτi)+Fθi=0,使用{τi=τθ}上的Lτi=max(Fτ,Mτθ)和{τi<τθ}上的Lτi=Lτθ=Fτθ,如前所述。当且仅当Gi(τi)(Mτi)- Fτi)≥ 0,在{τi<τθ}上相等Gi(τi)<1。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 14:07:32
然后我们最终可以表示Vi(Gi,Gi)=E[Sj(τa)|Fθ]asEh{τi<τ977;}{Gi(τi)>0}Mτi- FτiFθi+UθL(θ),其中UθL(θ)=E[~Lτ**带τ的L(θ)|Fθ**L(θ)=inf{t≥ θD|L(t)>DL(t)};参见(3.6)。此外,τi<τθ和Gi(τi)=1当且仅当τi=τ**所以我们可以重写vi(Gi,Gi)=EhLτ**L(θ)+1{τ**L(θ)<τθ}∩{Lτ**L(θ)=Fτ**~L(θ)}Mτ**L(θ)-~Lτ**L(θ)Fθi.备注B.1。如果L从右(和左)到上半连续,定理5.1仍然成立,但≡ M然后Dτθθl将保持连续(见fn.28),并且存在一个可行的混合策略Gθigiven byGθi(t):=1- 经验-Ztθ{Fs>Ls}d(dτθL)c(s)Fs- Ls-X[θ,t]ln{Fs>Ls}DτθL(s)Fs- Ls+1对于t∈ [θ,τθi),其中(DτθL)表示DτθLand的连续部分DτθL(s)=DτθL(s+)- DτθL(s),然后满足dgθi(t)=1.- Gθi(t){Ft>Lt}dDτθL(t+)Ft- Lt.那么证明中唯一的区别就是我们把dDL(·+)放在(B.3)的右侧和左侧(仅!)(B.4)。我们没有正确的连续性-~L,butR[θ,τ)(U~L-~L)dGi=0在(B.5)中仍然成立:dGi(·)在[θ,τi]上是绝对连续的w.r.t.dD@L(·+),对于这一点,我们可以应用一系列变量,如引理a.1中的τD@L(x):=inf{t≥0 | D)L(t+)>x}。然后τDL(x)=t<=> s>t:DL(t-) ≤ x<DL(s),表示τDL(x)处的UL=~L a.s;参见(3.5)。因此,E[R[0,∞){U~L>~L}dD~L(+)]=R∞E[1{U@L(τD@L(x))>L(τD@L(x))}]dx=0。最后,当τ<τθ和Gi(τ)>0 in(B.5),则简单地说U)L(τ)=Lτ=Lτ≡ Mτ现在,soit仍然足以考虑Gi(τi)在以下所有情况下,其中Gi(τi)>0,仅当UL(τi)=Lτi=Lτi=Fτi.定理5.3的证明。我们只需要建立时间一致性。如果假设成立,那么{(θ∨ θ′) ≤ (τθ∧ τθ′)不同于{(θ)∨ θ′) ≤ τθ=τθ′:=A∈ F(θ∨θ′)最多由anullset提供。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 14:07:36
只有该事件与时间一致性相关,因为(θ∨ θ′) > (τθ∧ τθ′)a.s.onac且当Gθi∨ Gθ′i=1。在a上有<<Lτθ=<<Lτθ′a.s.,也有<<Lτθa.s.\'∈T:τ′≥τE~Lτθ(τ′)Fτ= ess supτ′∈T:τ′≥τE~Lτθ′(τ′)Fτa、 关于{τ≥ (θ ∨ θ′)} ∩ A表示任意τ∈ T,意味着UτθL{T≥(θ∨θ′)}=Uτθ′L{t≥(θ∨θ′)a.s.onA(即后两个过程无法区分)由可选项目的唯一性决定。相应地,DτθθL=Dτθ′Lon[θ∨ θ′,∞] a、 Doob Meyer分解的独特性。等效形式的时间一致性(1- Gθi(t))=(1- Gθi(θ′)-))(1 - Gθ′i(t))读取给定的Gθias{t<τθi}exp-Ztθ{F>L}dDτθLF- L= 1{θ′≤τθi}exp-Zθ′θ{F>L}dDτθLF- L{t<τ′i}exp-Ztθ′{F>L}dDτθ′LF- L,在A和t上≥ (θ ∨ θ′)化简为真语句{t<τθi}exp-Ztθ{F>L}dDτθLF- L= 1{t<τθi}exp-Zθ′θ{F>L}dDτθLF- L经验-Ztθ′{F>L}dDτθLF- L感谢我们之前展示的东西。关于j的论点是一个无逻辑的论点。定理7.3的证明。修好我,j∈ {1,2},i6=j,并对扩展的混合策略进行了描述。对任何人来说θ∈ T然后τθ≤ inf{t≥ θLt>Ft}=inf{t≥ αi(t)>0},所以αi(t)>0=> Gθi(t)=1 a.s.,对于j也是如此。Gθi,Gθj的其他可行性条件来自定理5.1,而对于αθi,αθjare的可行性条件,如Riedel和Steg(2017)所示(在命题3.1的证明中,不使用他们的假设θ=inf{t)≥ θLt>Ft}和f≥ M) 。家庭的时间一致性(Gθi;θi)∈ T),(Gθj;θ∈ T)遵循定理5。3,以及两者(αθi;θi)∈ T),(αθj;θ∈ T)是时间一致的,因为αθifrom P Proposition 7.1不依赖于θ(T的αθi(T)=0∈ [0, θ)).
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 14:07:39
现在fix武断θ∈ T如τθ≤ inf{t≥ θ|αθi(t)>0},事实上αθi≡ ατθi对j也是如此,然后很容易从定义2.5和C.1中检查,随着时间的推移,Gθi,Gθj与Gτθi,Gτθj的一致性。,VθiGθi,αθi,Gθj,αθj= EZ[0,τθ)1.- GθjL dGθi+Z[0,τθ)1.- θiF dGθj+X[0,τθ)MθiGθj+1.- Gθi(τθ)-)1.- Gθj(τθ)-)VτθiGτθi,ατθi,Gτθj,ατθjFθ. (B.9)这里,Vτθi(Gτθi,ατθi,Gτθj,ατθj)=max(Fτθ,Mτθ)和(Gτθi,ατθi)是对(Gτθj,ατθj)的最佳回复。实际上,使用f{t中的停止时间^τθ=≥ θLt>Ft}≥ τθ,以下是{τθ=ττθ}∈ 命题7.1中的Fτθ应用于ττθ,而在{τθ<^τθ}上很容易通过定义2.5进行验证,C.1表示Gτθi(τθ)=Gτθj(τθ)=1,然后是τ<inf{t≥ τθ|ατθi(t)+ατθj(t)>0}和Mτθ≥ Fτθ(由于右连续性)。假设玩家i偏离任何可行的(Gθa,αθa)。首先假设αθa(t)≡ t<τθ时为0。然后,预期收益可以写成(B.9),其中(Gτθa,ατθa)构造为时间一致的,由Gτθa(t)=1{t≥τθ}(1{Gθa(τθ)-)<1} (Gθa(t)-Gθa(τθ)-))/(1-Gθa(τθ)-))+1{Gθa(τθ)-)=1} )和ατθa≡ αθa.因为这在τθ,Vτθi(Gτθa,ατθa,Gτθj,ατθj)是可行的≤ Vτθi(Gτθi,ατθi,Gτθj,ατθj),或将前者替换为(B.9)的类似物,至少产生Vθi(Gθa,αθa,Gθj,αθj)。现在考虑假设Mτθ=Vτθi(Gτθi,ατθi,Gτθj,ατθj)(对于之前观察到的实际Mτθ,Mτθ)。然后(B.9)也成为玩家i的预期收益,来自由Gθi,Gθj表示的标准混合策略,Gθi(τθ)=Gθj(τθ)=1。此外,Vθi(Gθa,αθa,Gθj,αθj)的界类似于(B.9)构造,成为Gθa在与Gθj比赛时调整为Gθa(τθ)=1(仍然可行)给出的标准混合策略的预期收益。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 14:07:42
因为假设诱导了Mτθ≥ Fτθ和as Fτθi≥ Mτθ离子{τθi<τθi}通过构造,定理5.1现在暗示Vθi(Gθa,αθa,Gθj,αθj)≤ Vθi(Gθi,αθi,Gθj,αθj)。Fu rthermore,引理3.1意味着,在Mτθ假设下,任何扩展混合策略在θ与Gθjc代表的标准混合策略的预期收益永远不会超过Vθi(Gθi,αθi,Gθj,αθj)。因此,为了处理任意可行的αθa,它仍然需要用一个与Gθj对抗的可行策略来约束预期收益≤ ^τa:=inf{t≥ θ|αθa(t)>0},那么前面的参数可以调整如下。Asαθj(t)≡ 对于t<τθ,与(Gθa,αθa)类似的(B.9)的积分和和限制为[0,τθ)∧ ^τθa),期望值还包括1{^τθa<τθ}(λθL,iL^τθa+λθL,jF^τθa+λθMMθa),并且继续支付适用于{τ≤ ^τθa}。有界onVθi(Gθa,αθa,Gθj,αθj)由对连续值的相同估计产生。如果再次调整(Gθa,αθa)以满足Gθa(τθ)=1和αθa(t)≡ 0代表t∈ [τθ, ∞) (这是可行的),那么在与Gθjun的比赛中,在Mτθ的相同假设下,它的预期收益实际上变成了现在的界限。现在来看,唯一的区别是注意到,{^τθa<τθ}没有任何变化,因为那时(αθa,αθj)在ττado的结果概率不依赖于t的值≥ τθ和Mτθ没有影响。验证玩家j的最优性是完全类似的,因为没有使用i和j的特定角色。类似地,如果Fτ=Mτ或τ=inf{t>τ| Lt>Ft}每当Lτ=Fτ时,则条件Gθi(M)- F)=0在τθia处。s、 定理5.1中关于{τθi<τθi}的结论成立,之前的论证证明(Gθi,αθi)是对其本身的最好回答。B.2命题8.1的证明我们从三个引理B.2–B.4开始,它们为支付对称均衡中的策略和支付建立了一些重要的必要条件。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 14:07:46
它们对于后续的Proposition 8.1预防至关重要。引理B.2。在任何支付对称子博弈完美均衡和任何θ∈ T,Z[0,T){Ls6=Fs}1.- Gθ(s)-)dGθ(s)=Z[0,t){Ls6=Fs}1.- Gθ(s)-)dGθ(s)代表所有t∈ R+a.s.因此{Lt6=Ft}dGθ(t)1.- Gθ(t)-)= 1{Lt6=Ft}dGθ(t)1.- Gθ(t)-), (B.10)如果(1)被解释为“=0”- Gθ(t)-))(1 - Gθ(t)-)) = 0.两位代表都支持(1)- Gθ(·)),(1)- Gθ(·))代替左侧极限。证据首先考虑任意τ∈ T与θ≤ τ ≤ ^τθ=inf{t≥ θ|αθ(t)+αθ(t)>0}a.s.与(B.9)类似,时间一致性和迭代期望意味着i,j∈ {1,2},i6=j,thatVθiGθi,αθi,Gθj,αθj= EZ[0,τ)1.- GθjL dGθi+Z[0,τ)1.- θiF dGθj+X[0,τ)MθiGθj+1.- Gθi(τ)-)1.- Gθj(τ)-)VτiGτi,ατi,Gτj,ατjFθ(B.11)=EZ[0,τ)1.- Gθj(s)-)LsdGθi(s)+Z[0,τ)1.- θi(s)-)FsdGθj(s)+X[0,τ)(Ms)- Ls- (财政司司长)θi(s)θj(s)+1.- Gθi(τ)-)1.- Gθj(τ)-)VτiGτi,ατi,Gτj,ατjFθ.在支付对称均衡中,Vθ(·)- Vθ(·)=Vτ(·)- Vτ(·)=0。因此,EZ[0,τ)1.- Gθ(s)-)(Ls)- Fs)dGθ-Z[0,τ)1.- Gθ(s)-)(Ls)- Fs)dGθFθ= 0表示任意τ∈ [θ, ^τθ]. 这些积分表示两个有符号的可选随机测度,它们与Gθi(θi)在[0,^τθ](在[0,θ)上的所有可选集一致-) = 0; 可选σ场由随机区间[0,τ),τ∈ T)。L和F是可选进程,因此我们可以取消(L- F)6=0以观察两个左连续(因此是可选的)进程sr[0,t){Ls6=Fs}(1- Gθ(s)-)) dGθ(s)andR[0,t){Ls6=Fs}(1)- Gθ(s)-)) dGθ(s)在任何停止时间τ的预期一致≤ ^τθ.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 14:07:49
因此,它们在^τθ之前无法通过可选投影的唯一性进行区分。作为Gθ(s)∨ Gθ(s)=1代表所有s≥ ^τθ,测度r[0,t){Ls6=Fs}(1)- Gθj(s)-)) dGθi(s)通常依赖于d,j依赖于[^τθ],特别是当L^τθ6=F^τθ和Gθi(^τθ)<Gθj(^ττθ)=1,因此^ττθ=inf{t≥ θ|αθj(t)>0}<inf{t≥ θ|αθi(t)>0}。通过时间一致性,子博弈中从^τθ开始的策略具有相同的属性,然后很容易从定义C.1中检查V^τθi(·)=G^τθi(^τθ)1.- α^τθj(^τθ)L^τθ+1.- G^τθi(^τθ)F^τθ+G^τθi(^τθ)α^τθj(^τθ)M^τθ=G^τθi(^τθ)1.- α^τθj(^τθ)L^τθ- F^τθ+α^τθj(^τθ)M^τθ+ F^τθ,(B.12)V^τθj(·)=G^τθi(^τθ)1.- α^τθj(^τθ)F^τθ+1.- G^τθi(^τθ)L^τθ+G^τθi(^τθ)α^τθj(^τθ)M^τθ=α^τθj(^ττθ)Gi(^τθ)M^τθ- F^τθ+ G^τθi(^τθ)F^τθ+1.- G^τθi(^τθ)L^τθ。(B.13)给定L^τθ6=F^τθ,支付是对称的当且仅当G^τθi(^τθ)(1)- α^τθj(^τθ))=1- G^τθi(^τθ)。然后G^τθi(^τθ)>0,并通过(B.12)中的线性给出G^τθi(^τθ)<1,因此(1-α^τθj(^τθ))L^τθ-F^τθ+α^τθj(^τθ)M^τθ=0。对于L^τ977; 6=F^τ977;,这意味着αττ977; j(^τ977;)>0,并且仅当αττj(^τ977;)=1时,M^τ977;=Fτ977;,但这被Payoff对称性和G^τ977; i(^τ977;)排除在外。然而,α^τθj(^τθ)∈ (0,1)和G^τθi(^τθ)>0需要(B.13)中的线性M^τθ=F^τθ,这表明我们不能有正概率的L^τθ6=F^τθ和G^τθi(^τθ)<1。这意味着我们之前的措施在[0,∞) a、 s.R[0,t](1)- Gθ(s)-))(Ls)- Fs)dGθ(s)andR[0,t](1)- Gθ(s)-))(Ls)- Fs)dGθ(s)是适应的、右连续的和有限变化的。它们的最小分解是使用(L- F)+和(L)- F)-, 分别地表示式(B.10)通过积分[(1- Gθ(s)-))(1 - Gθ(s)-))]-1on{Gθ(s)-) ∨ Gθ(s)-) < 1} 每种测量方法的水渍试验。最后,1{L6=F}(1- Gθ)dGθ=1{L6=F}(1)-Gθ)dGθ是类似地获得的,甚至没有重写(B.11)。引理B.3。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群