因此,根据迭代期望定律,EPu,φLit(h,zi)≤Ptτ=1τ-2EPu,φhln Qiστ(zi)Qiστ(zi)i,它又在1上有界,因为(lnx)x≤ 1.十、∈ [0,1],我们使用(ln0)0=0的约定。因此,suptEPu,φ[|Lit |]≤ 1.根据理论。2.8在Durrett(2010)中,Lit(h,zi)将a.s.-Pu,φ收敛为有限Li∞(h,zi)。因此,byKronecker引理(Pollard(2001),第105页),limt→∞Pzi∈子T-1Ptτ=1zi(ziτ)-\'Piστ(zi)ln Qiστ(zi)= 因此,limt→∞κi1t(h)=0。接下来,考虑κi2t(h)。假设limt→∞σt=σ,并且Qiσln的连续性,Qiσinσ意味着limt→∞κi2t(h)=-P(si,xi)∈Si×XiEQσ(·| Si,xi)[ln Qiσ(Yi | Si,xi)]σi(xi | Si)pSi(Si)。κi1t,κI2t的极限意味着,γ > 0, ^tγ使得,T≥^tγ,κi1t(h)+κi2t(h)+X(si,xi)∈Si×XiEQσ(·| Si,xi)ln Qiσ(Yi | si,xi)σi(xi | si)pSi(si)≤ γ. (14) 现在我们通过刻画κi3t(h,θi)的极限来证明(i)-(iii)。(i) 无论如何∈ 子,频率(zi)-πσ(zi)≤T-1吨-1τ=0zi(ziτ)-\'Piστ(zi)+T-1吨-1τ=0\'Piστ(zi)-πσ(zi). RHS中的第一项变为0(证明基本上与The相同)。这个引理意味着对于序列(`t)tifPτ`τ<∞, 然后,τ=1bτbt′τ→ 0,其中(bt)是一个非递增的正实数值,它发散到∞. 我们可以用\'t\'应用引理≡ T-1ltandbt=t.证明κi等于0)。第二项为0,因为limt→∞σt=σ,且“Pi”是连续的。因此ζ > 0, ^tζ使得,T≥^tζ,子∈ 子,频率(zi)-πσ(zi)< ζ(15)因此,由于θi∈^Θi,limt→∞κi3t(h,θi)=P(si,xi)∈Si×XiEQσ(·| Si,xi)ln Qiθi(Yi | si,xi)σi(xi | si)pSi(si)。该表达式和(14)建立了第(i)部分。(ii)对于所有θi/∈ Θiσ,ξ,设ziθibe,使得πσ(ziθi)>0和Qiθi(ziθi)<ξ。到(15),tpiL/2suchT≥ tpiL/2,κi3t(h,θi)≤ 频率(ziθi)ln Qiθi(ziθi)≤ (piL/2)lnξθi/∈ Θiσ,ξ,其中piL=minZi{Piσ(zi):\'Piσ(zi)>0}。