但是πn=SnAn=NnXk=1λni^AkniAn^πkni,即πnis是πkn,πknnand因此[π,π]-值且可容许。接下来,考虑财富过程*= {A*s} s∈[0,T]由拜达提供*s=[rA]*s+σθs*s+ct,ys]ds+σs*sdWs,s∈ [t,t],带着*=xon[0,t]并观察到,使用Anda的动力学*, Jensen不等式,并且它是等距的,存在一个常数C>0,这样E|A.*s- Ans|≤ C EhZst|A*U- Anu|dui+C EhZst|S*U- 酒后驾车≤ 捷克|A.*U- 阿努|du+C EhZT | S*U- 酒后驾车∈ [t,t]。具有时变随机禀赋的最优投资Ronwall不等式→∞E|A.*s- Ans|≤ 画→∞C EhZT|S*U- Snu | duieC(T-t) =0,s∈ [t,t]。设定π*:=s*/A.*, 利用(Sn,An)到(S)的收敛性*, A.*), 因此π*是[π,π]-valueddt Palmost everywhere(因此,在重新定义π之后,不会失去普遍性)*在空集上),因此是可容许的。显然,一个*财富过程是否与π相对应*.此外,由于Uγ(AnT)=|AnT | 2γ/|γ|,引理2.1得出{Uγ(AnT)}n∈Nis在平方可积随机变量空间中有界,因此一致可积。由此,利用Uγ的凹度,我们得出UγA.*T= 画→∞EUγ蚂蚁≥ 画→∞NnXi=1λniEUγ^AkniT= V(t,x,y)。通过函数^π形成*定义见(4.1)。定理4.2(反馈形式的最优策略)。固定(t,x,y)∈[0,T)×O,设π∈π是一种任意策略,假设V∈ C1,2((0,T)×O)。那么π是最优的当且仅当(4.3)πs(ω)=^π*s、 As(ω),cs(ω)为了P ds几乎每(ω,s)∈ Ohm ×[t,t]∩ (0,T),其中A:=Aπ,t,x,yand c:=ct,y。第一步:假设π∈π是一种任意策略(4.3)。