认怂固然丢面子,但相比玉石俱焚的结果来说,保命显然更重要。因此对一个足够理性的人来说,应该在他能够控制的最后时刻选择C策略,即果断认怂。而如果甲方相信乙方是一个足够理性的人的话,那他应该能够预料到乙方会在最后时刻放弃,所以甲方的最佳策略是死磕到底(D策略),对应的结果就是(D, C),类似的情况反转过来是(C, D)。当然要是双方都这么想的话,最后的结果很可能是(D, D)。有趣的是,在胆小鬼博弈中当一方的选择受到了限制时,其赢面 可能 会变大。例如在赛车的虚拟游戏中,甲方的方向盘被锁死,不得不选择 D 的话,乙方再傻也会知道识时务者为俊杰,选择 C 的结果 -1要远好于同归于尽的 -10。
通常, (C, D) 和 (D, C) 被称为胆小鬼博弈的纳什均衡点,即在这个状态下,如果一方不改变其策略,不论对方采取什么策略都不会有更大收益。例如对于 (D, C) 而言,甲方心意已决,就算乙方将对策由认怂改为死磕,结果也是两败俱伤而不会收益更高。类似的,如果乙方已经决定认怂,甲方不再死磕也选认怂的话,其收益将从 +1 变为 0。
这两个纳什均衡点被称为“纯策略均衡点”,即双方采取的是一个 C 和 D 之间一个确定策略。而当甲乙至少有一方采取的策略是不确定的时候,我们可以用下图来表示双方的决策:
其中 x 表示甲方的策略, y 表示乙方的策略,位于 [0,1] 区间的 p' 表示某方采取 D 策略的概率。左边的图意味着甲方以概率 p' 采取 D 策略,乙方则一定会根甲方 D 到底。中间的图表示相反的情形。右边的图表示甲乙双方是否采取 D 策略都都属于不确定事件,两条虚线的交点就是胆小鬼博弈的第三个纳什均衡点(混合策略均衡点)。假定甲乙双方无差别,也就是说他们都以同样的概率 p' 来决定是否死磕到底(策略D),因此混合策略均衡点总是在对角线上。
现实中的例子:劳资谈判
本帖隐藏的内容
一般来说,混合策略的纳什均衡点只是局部最优,换言之,如果双方能够在某种意义上“合作”的话,收益将大于混合策略均衡点的情形。让我们来考虑一个实际中的例子:劳资谈判。这里同样用 C 来表示妥协, D 表示坚持:
假定劳资双方在充分考虑损失后,都决定以 1/3 的概率选择 D 策略,那他们的期望收益(因为表中的收益是对称的,只需要计算一方的结果即可)就是:
如果现在有一个第三方机构介入(比如某个调解机构),这个机构可能给出的裁决结果是 (C, D)、(D, C) 和 (C, C) 中的一个,三种结果的概率各为 1/3。在该机构裁决后,会分别向劳方和资方通报他们各自应当采取的策略,但不告诉他们对方得到的结果。从收益上讲,尽管不知道对方被告知的策略是什么,劳资双方仍然会倾向于接受该机构的裁决。因为拒绝接受这个调解策略也不可能有更大收益。
比如劳方被告知应当采取 D 策略,那资方一定会被建议采取 C 策略(双输的结果不在可能的裁决范围内),显然这是最有利的结果。如果劳方被告知应当采取 C 策略,可以认为资方被告知选 C 策略和 D 策略的可能性分别是1/2,所以劳方期望收益就是:
如果劳方对这个裁决结果不满意,强行采取D策略,期望的收益则会变为:
这个收益小于劳方接受裁决结果的期望收益。因为资方和劳方的收益表是对称的,同样的分析也适用于资方。
由此可见,一方不论被建议的策略是 C 还是 D,接受该策略的期望收益都大于采取另一策略的情形。当然在现实中,双方的收益表、损失评估(即采取不同策略的概率)和第三方机构作出不同裁决的可能性都会有所变化,对具体的例子,是否接受裁决结果仍然要计算以后才能知道。
当然,古巴导弹危机本身牵涉甚广,除美国和苏联之外古巴也扮演了重要角色(例如卡斯特罗曾密电赫鲁晓夫建议苏联先下手),此外美苏国内各方的压力也对各自的决策产生了影响,因此很难以最简单的胆小鬼博弈来分析,有兴趣的读者可以参考下面这篇文章,作者 Steven Brams 是美国纽约大学政治系的教授,他以对政治学和博弈论的研究而知名。