存在这样的情况c>c:R(w,σ>c)<R((0,∞)), R(w,σ≥c) <R((0,∞))o R(w,σ>c)在c中从右起连续,R(w,σ≥c) 在c中从左边开始是连续的,这两个函数具有相同的不连续点:c使得F({τ:γ(τ)=c})>0(这些也是它们唯一的不一致点)。要了解这些事实,请观察F(σ>c)和F(σ≥c) 分别具有相同的属性。因此,函数max(R(w,σ≥c) c的R(w,σ>c))在某些c下达到最大值*∈ [0,C]。换句话说,存在c*因此c、 最大值(R(w,σ≥c*), R(w,σ>c*)) ≥ 最大值(R(w,σ≥c) ,R(w,σ>c))。在第二个子部分中,我们通过证明R(w,σ≥c*) ≥ R(w,σ>c*), i、 例如,我们可以在保险单的每一时间价值的边际上包含折扣假设c*≥ R(w,σ>c)*). 然后,通过与第(3)行相同的参数,R(w,σ≥c*) ≥ R(w,σ>c*),包括边际旅行会增加回报。o假设c*< R(w,σ>c*).– 如果B:c*< B使得质量F({τ:γ(τ))∈ (c)*, B] })=0,然后注意σ>c*等于σ≥Bup到一组度量值0,因此R(w,σ>c*) = R(w,σ≥B) .–否则,让B:c*< B<R(w,σ>c*), 注意F({τ:γ(τ))∈ (c)*, B] })>0。然后,通过与第(4)行相同的参数,R(w,σ>c*) < R(w,σ>B)≤ 最大值(R(w,σ≥c*), R(w,σ>c*)) =R(w,σ≥c*): 我们可以删除子集(c*, B) 从政策σ>c*提高奖励,等等σ≥c*必须是最优的。因此存在c*, 对于所有σ,我们有R(w,σ≥c*) ≥ R(w,σ)。C、 3命题3.1的证明在单一状态下,如果0,则w(τ)=mτ+a是激励相容的≤ 一≤mλ。证据证据设T=Rτ∈(0,∞)τdF(τ)。