经过下午的思考,我明白这个问题了,请zjh69 一起讨论。
假定先由1选 则当1选择L的时候,2的最优反应是 (1,2) ,(1,2)
当1选择R的时候,2的最有反应是 (2,1 ),(2,1 )
再由2来选,注意这里2选择的是战略而不是行动,这也是我没有想好的地方
这样当 2选择 (L, L,)策略时候,对于1来说最优反映就是(3,1)
以此类推,最后的交集就是{L,(R, R,)} {R, (R, L,) } 。得解。
当然这里面对于{L,(R, R,)} 是不可信的威胁所导致的纳什均衡,而只有{R, (R, L,) } 才是子博弈精炼纳什均衡。
