然后,不确定漂移投射到观测滤波器上[b(t,X(t);θ(t))|F(t)]=\'b(t,X(t),π(t))。(5.7)让W成为创新布朗运动。给定任意容许脉冲控制(τ,ζ)∈ 一、 当k=0,1,·,N时,增广态过程(X(·),π(·))在每个时间间隔[τk,τk+1]上是(m+2)维马尔科夫过程- 1,因为它是受控SDE的唯一强解决方案X(t)=X+Zt\'b(s,X(s),π(s))ds+Ztσ(s,X(s))d\'W(s)+Xτi≤tγ(X(τi-), ζi);π(t)=1- λZt∏(s)ds+Ztb(s,X(s);u) -\'b(s,X(s),π(s))σ(s,X(s))π(s)d\'W(s);πi(t)=piλZt∏i(s)ds+Ztb(s,X(s);ui)-(X(s)i(s),σs≤ T≤ T.(5.8)然后可以使用状态过程(X(·),π(·))来解决物理测量下的脉冲控制问题(2.17),作为一个完全观测问题。最优脉冲控制通过常规的动态规划参数表示为值函数和状态过程。让我们继续证明后验概率法和测度变换法在理论上是等价的。与外稃3中的相比。存在价值函数u,u,··,uN:[0,T]×R×[0,1]m+1→ R使得uk(t,x,π)=esssup{(τi,ζi)}Ni=N-k+1∈是的,克ZTth(s,X(s))ds+ξ(X(T))+NXi=N- k+1c(X(τi)-), ζi)F(t),(5.9)对于k=1,··,N,和u(t,x,π)=EZTth(s,X(s))ds+ξ(X(T))F(t).(5.10)通过推导定理3.1的相同推理,分别来自后验概率法和测度变换法的两组值函数通过方程suk(t,x,π)=ξ(x)+vk(t,x,l,r),k=0,1,··,N,(5.11)对所有x进行关联∈ R、 π∈ [0,1]m+1,l∈ (0, ∞)m+1和r∈ [0, ∞)M