通过uf(通过所有相关函数的连续性存在)表示最小化策略,并使用Dynkin公式,我们可以写出0=Ex“ZT∧τufe-δtc(uf)f(Xuft-) - (δ+λ)f(Xuft-)+ λZρ(Xuft-,uf)f(Xuft-- r(y,uf))dFY(y)+λZ∞ρ(Xuft-,uf)w(Xuft-, r(y,uf)- Xuft公司-) dFY(y)!dt#=Exhe-δ(T∧τuf)f(XufT∧τuf)1T6=τufi- f(x)+Ex“中兴通讯-δtλZ∞ρ(Xuft-,uf)w(Xuft-, r(y,uf)- Xuft公司-) dFY(y)dt 1T=τuf#=Exe-δTf(XufT)1T<τuf+ Exhe公司-Δτuff(0)1T>τufi- f(x)+Ex“中兴通讯-δtλZ∞ρ(Xuft-,uf)w(Xuft-, r(y,uf)- Xuft公司-) dFY(y)dt 1T=τuf#。我们现在使用补偿理论emex“ZTλe”-δtHtdt#=Ex“中兴通讯-δtHtdNt#=Exe-δTHT,其中λ是计数过程Nt的强度,对于前一个过程ht:=Z∞ρ(Xuft-,uf)w(Xuft-, r(y,uf)- Xuft公司-) dFY(y)。取引理yieldsf(x)=Ex中的uf(0)e-δTf(XufT)1T<τuf+ 前任e-δTw(XufT-, |XufT |)1T=τuf+ Exhe公司-Δτuw(0,0)1T>τufi,因为如果c(uf(0))为1T>τuf=0≥ 0所以我们展示了f≥ Gf。另一方面,gf(x)=infu∈取消-δTf(XuT)1T<τuxi+Exhe-δTw(XuT-, |XuT |)1T=τuxi+Exhe-Δτuxw(0,0)1T>τuxio=infu∈U(f(x)+Ex“ZT∧τue-δtc(u)f(Xut-) - (δ+λ)f(Xut-)+ λZρ(Xut-,u) f(Xut-- r(y,u))dFY(y)!dt#+Exhe-Δτuxw(0,0)1T>τuxi+Ex“ZT∧τue-δtλZ∞ρ(Xut-,u) w(Xut-, r(y,u)- Xut公司-) dFY(y)dt#)≥ f(x)中,我们再次使用了最后一个表达式的补偿定理,最后一个不等式来自HJB方程。以下定理是引理3.1和3.2与巴拿赫不动点定理相结合的直接结果。这也是本节的中心陈述,因为它将HJB euqation确立为发现价值函数的关键工具。定理3.5。在函数空间C+,b[0,∞), 值函数是G的唯一固定点,因此也是HJB方程的唯一解。4个数值示例根据上一节的结果,我们可以通过找到Hamilton-Jacobi-Bellman方程的解来构造值函数。