因此,当参与者遵循最优策略时,我们得到了稳定策略集的以下特征。Doraszelski和Escobar(2010)研究了Bellman方程的类似扰动版本。定理4。假设对于一个受干扰且弱识别的博弈,一个策略变量σ在最优策略变量下是稳定的。σ是博弈的伯克-纳什均衡。证据证明的第一部分与定理2的证明相同。在这里,我们证明,鉴于limj→∞σt(j)=σ和limj→∞uit(j)=ui∞∈ (Θi(σ))i、 然后,i、 σiis对于给定ui的扰动对策是最优的∞∈ (Θi),即。,(si,xi),σi(xi | si)=Pξξi:ψi(ui)∞, si,ξi)={xi}, (26)式中ψi(ui)∞, si,ξi)≡ arg maxxi∈谢琪一号∞(·| si,xi)[πi(xi,Yi)]+ξi(xi)。建立(26),fix i∈ 我和si∈ 硅。森林杰→∞σit(j)(h)(xi | si)=limj→∞Pξξi:φit(j)(uit(j),si,ξi)=xi= Pξξi:Φi(ui)∞, si,ξi)={xi},其中第二行后面是φi引理3的最优性。这意味着σi(xi | si)=Pξ(ξi:Φi(ui∞, si,ξi)={xi})。因此,仍需证明pξξi:Φi(ui)∞, si,ξi)={xi}= Pξξi:ψi(ui)∞, si,ξi)={xi}(27)因此Pξ(ξi:Φi(ui∞, si,ξi)={xi}>0。从现在起,固定任何此类xi。由于σi(xi | si)>0,游戏弱识别的假设意味着Qiθi(·xi,si)=Qiθi(·xi,si)θi,θi∈ Θ(σ). 事实是我∞∈ (Θi(σ))则意味着bi(ui∞, si,xi,yi)=ui∞(28)易∈ 易。