真正的不公平需要指出的是,这个游戏确实不是公平的,只不过玛丽莲采用了错误的分析方法。
人们在玩游戏的时候总会自己制定一些策略。在博弈论中,策略(strategy)有两种,一种是确定的,称为纯策略(pure strategy),在什么情况下出什么牌、做出什么选择都已经定好,只需要照章办事。另一种是随机的,叫作混合策略(mixed strategy),给你的所有动作都定一个概率,按概率随机从中选一个。人们在说到随机的时候,直觉上倾向于认为各种情况等概率出现,而有时候,控制某些情况出现的概率却会产生神奇的效果。上面我们已经看到玛莉莲就采用了混合策略,而我们又想出了新的混合策略来应对。
任何一个游戏中,玩家们都会想方设法让自己的利益最大化,有时甚至作出出人意料的决定,这让游戏的局势变得错综复杂,典型的例子就是海盗分金问题 。可在这复杂的关系下,存在一个惊人的规律,那就是在有限人的游戏中,总存在这样一种情况,每个人都能采取一种策略,使得他的利益不能再增大了。这就是博弈论中重要的纳什均衡(Nash Equilibrium)。纳什均衡分为纯策略纳什均衡(pure strategy Nash equilibrium)和混合策略纳什均衡(mixed strategy Nash equilibrium),前一种是所有玩家都采取纯策略,后一种则是至少有一人采取混合策略。
回到美女请你玩游戏这个问题。列出我们的收益矩阵:
在m行n列的收益矩阵a中,存在如下不等式:

当它能取到等号时,游戏存在纯策略纳什均衡。简单来说就是玩家都能够采取固定的策略(比如一直出正面或者一直出反面),使得每人都赚得最多或亏得最少。否则只存在混合策略纳什均衡。而在这个问题中,行最小值的最大值(-2)不等于列最大值的最小值(1),所以这个游戏只存在混合策略纳什均衡。
假设我们出正面的概率是x,反面的概率是1-x。为了使利益最大化,应该在对手出正面或反面的时候我们的收益都相等,不然对手总是可以改变正反面出现的概率让我们的总收入减少,由此列出方程就是
3x + (-2)*(1-x)=(-2) * x + 1*( 1-x )
解方程得x=3/8,也就是说平均每八次出示3次正面, 5次反面是我们的最优策略。而将x= 3/8代入到收益表达式 3*x + (-2)*(1-x) 中就可得到每次的期望收入,计算结果是 -1/8元。
类似的,列出美女的收益矩阵。
设美女出正面的概率是y,反面的概率是1-y,列方程
-3y + 2( 1-y )= 2y + (-1) * ( 1-y )
解得y也等于3/8,而美女每次的期望收益则是 2(1-y)- 3y = 1/8元。这告诉我们,在双方都采取最优策略的情况下,平均每次美女赢1/8元。
其实只要美女采取了(3/8,5/8)这个方案,不论你再采用什么方案,都是不能改变局面的。如果全部出正面,每次的期望收益是(3+3+3-2-2-2-2-2)/8=-1/8元;如果全部出反面,每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。而任何策略无非只是上面两种策略的线性组合,所以期望还是-1/8元。但是当你也采用最佳策略时,至少可以保证自己输得最少。否则,你肯定就会被美女采用的策略针对,从而赔掉更多,比如上述玛丽莲的解答。
另外借助于计算机模拟这个游戏,我们也可以轻而易举地得到一样的结论。这里附上一个这样的小程序,算是另一个证明吧。
说到这里,美女之心,路人皆知了。不过既然是主动送上门,而你又不会输得太多,不妨考虑采用最佳策略慢慢陪她玩吧。说不定这个美女足够聪明,察觉到了你早已洞察一切却依然绅士,好感油然而生,改变心意了呢。