请教大家,
在有限次重复博弈中,单阶段纳什均衡不是唯一的情况下,怎么选择策略?如张维迎的<<博弈论和信息经济学>>中的212页,为什么第二阶段选择混合策略而不是纯策略?
谢谢!
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
如果存在多个纳什均衡,但是这些均衡帕雷托劣于其他非纳什均衡策略,那么代理人可以通过选择混合策略(也是纳什均衡)来对另一人施加惩罚,使得双方都认为选择帕雷托最优的那组策略是最优的。混合策略的作用在于潜在惩罚。
这实际上意味着,这个子博弈精炼纳什均衡有可能包括非纳什均衡(帕雷托最优策略)。这一点我也觉得奇怪,会不会是特殊情况?