我们只考虑纯策略的均衡, 在单期的情况下,有两个纳什均衡(partly confess, partly confess)和 (confess, confess). 在双期情况下,不考虑贴现率,以上两个纳什均衡重复两次也形成子博弈完美均衡。第一期(partly confess, partly confess) 第二期(confess, confess),或者倒过来也是子博弈完美均衡。 这道题被提出来的最重要原因是除了以上的均衡外,还有一个包括 not confess(NC) 这个策略的均衡:
博弈双方,
第一阶段选择 NC;
第二阶段,如果第一阶段的结果是(NC, NC),就选择 partly confess(PC),否则,选 confess.
证明这是一个子博弈完美均衡的简单方法就是在没有参与者有动机单方面改变策略,
现在假设A严格执行以上策略。对B来说,严格执行的收益是第一阶段 0,第二阶段-1, 总收益 0+(-1)=-1;
如果改变,考虑第一阶段,给定A选择 NC, 选 confess 是 B的最优, 收益为 1; 第二阶段,观察到B第一阶段选择confess而不是 NC, A 会选择confess, B的最好应对也是confess, 所以第二阶段双方的收益均为-5. 这样, B 单方面改变现状的总收益是 1+(-5)=-4, 小于严格执行的总收益(-1),所以B 没有动机改变。
同样的逻辑,A 也没有动机单方面改变策略。 所以
博弈双方,
第一阶段选择 NC;
第二阶段,如果第一阶段的结果是(NC, NC),就选择 partly confess(PC),否则,选 confess. 也是一个子博弈完美均衡,而且在这个均衡情况下,总收益高于所有其他均衡。