为此,对于任何给定的k,首先构造将是有用的∈ N、 非公开的prom p检查策略q(∞ ) > k点方向,安第斯[Aqv]- [cq]≥ E[Aqκ]。(76)施工将在k进行归纳。对于k=0,请注意《mma 11》中定义的保单是非公开且及时的。设置q=q并应用引理11我们得到[Aqv]- [cq]≥ EAqσ- C≥ E[Aqκ]自σ≥ κ和c=0。这就完成了归纳法的基本情况。对于k>0,假设我们已经有一个非公开的即时检查策略q′,这样q′就(∞) > K- 1点方向,andEhAq′v- cq′i≥ EhAq′κi.(77)设V是所有样本点的集合,其中q′(∞) = 注意,V∈ Fk,∞.回顾引理11中定义的政策qkde,我们定义q等于qkon Vand to q′onOhm \\ 五、通过构造,q是即时的,q是(∞) > k点方向。无论如何l > 我们有(∞) > l <==> (q′)(∞) = k和qk(∞) > l) 还是q′(∞) > l,这表明事件q(∞) > l 属于Fl,0,确认q是有效的检查策略。我们关于q′是非暴露的归纳假设意味着V,q的补码中的所有样本点满足定义非暴露政策的属性。在属于V的样本点上,q′是非暴露的,并且q′是(∞) = k加在一起意味着σk=κk。这意味着q(与政策qkon V相似)在第一个点停止l > k使得σl≤ 如果是这样的话l存在,否则它完成所有检验阶段,当且仅当v>σk时获取项目。回顾σk=κk,我们看到前一种情况意味着qstop在某个阶段l < ∞ 这样∑l= κl, 后一种情况意味着q(∞) = ∞Aq=1当且仅当v>σk=κ。这就完成了q不暴露的验证。应用引理11,我们发现[1V(Aqv- cq)]=E五、Aqσk- ck= E五、Aqκ- ck, (78)其中,第二个等式使用的事实是,在V中的每个样本点,Q=1,关系σk=κ成立。