从囚徒困境看博弈论的一厢情愿

johnyj

12983

收藏 2005-08-26

囚徒困境博弈

---------------------------------------------------------------- 塔克是从这样一个小故事开始的：两个夜贼，鲍伯(Bob)和艾尔(Al)，在行窃现场附近被抓获并被警方隔离拷问。每个夜贼都必须选择是否坦白和揭发对方。如果两个贼都不坦白，他们都将被判刑一年。如果每个贼都坦白并揭发对方，他们都将在监狱中度过10年。但是，如果一个贼坦白并揭发对方，而另一个贼不坦白，那么与警方合作的贼将被释放而另一个贼将在监狱中度过20年。在这个例子中的战略是：坦白与不坦白。赢利（payoff）（实际上是处罚）是判刑。我们可以用“赢利表（payoff table） ”简洁地表达上述信息，这类赢利表已经成为博弈论中很好的标准表达式。以下是囚徒困境博弈的赢利表。表2-1 　　　　　　　　　　　　　艾尔　　　　　　　　　　　坦白　　　不坦白鲍伯　　　坦白　　　10，10　　　0，20 　　　　　不坦白　　20，0　　　　1，1 这个表的读法是这样的：每个囚犯从两个战略中选择一个。即，艾尔选择一列，鲍伯选择一行。每个单元格的两个数字告诉两个囚犯相应的战略被选择后的结果。逗号左边的数字表示选择行的人（鲍伯）的赢利，逗号右边的数字表示选择列的人（艾尔）的赢利。因此（先阅读第一列），如果他们都选择坦白，每人将判刑10年，但是如果艾尔坦白而鲍伯不坦白，鲍伯被判20年而艾尔将被释放。那么：怎样求解这个博弈？如果双方都想使自己呆在监狱的时间最短，他们选择什么战略是“理性的”？艾尔可能会做这样的推理：“两种事件可能发生：鲍伯要么坦白要么保持沉默。假定鲍伯坦白，我不坦白的话将被判20年，我也坦白的话则判10年。另一方面，如果鲍伯不坦白，我不坦白我被判刑1年，但在这种情况下，如果我坦白我可以被释放。无论怎样，我选择坦白都是最好的。因此，我将坦白。” 但是鲍伯能够而且大概也将做同样的推理——因此他们都将坦白并且都在监狱呆10年。然而，如果他们“不理性”地行动，都保持沉默，他们都可以在1年后被释放。 -----------------------------------------------------------------------------------------------

对于这个经典案例，很早就有人分析过，博弈论成立的基础是把别人当作傻瓜。那张赢利表是问题的关键：

　　　　　　　　　　　　　艾尔　　　　　　　　　　　坦白　　　不坦白鲍伯　　　坦白　　　10，10　　　0，20 　　　　　不坦白　　20，0　　　　1，1

根据这张表，我们假设囚犯会概率论(尽管这是比较荒唐的)，以艾尔为例，可以看到如果选择坦白一列，可能的结果是10X50%+0X50%=5年，而不坦白一列，结果是20X50%+1X50%=10.5年。如果他会概率论，他就会选择坦白。可问题是他如果不会概率论呢？

又，假设警察告诉他们的是另一张表：

　　　　　　　　　　　　　艾尔　　　　　　　　　　　坦白　　　不坦白鲍伯　　　坦白　　　20，20　　　 0，10 　　　　　不坦白　　10，0　　　　1，1

显然这时候两个人的选择都是不坦白，因为不坦白那一列的可能囚禁年数较少。

因此这张表才是问题的关键，作为会概率论的罪犯，他们的选择完全取决于这张表。因此对于象纳什那样既天真而又会概率论的囚徒，警察可以任意使用不同的表来获得自己想要的回答。

但事实是，这套把戏只能对付新手。稍微老道一点的囚徒，都会意识到这张表是问题的关键，在他们被捕之前，肯定已对于这张表或者说法律的程序了如指掌，因此无论警察如何套供，肯定是拒不承认。这一点，可以在众多香港影片中看到：黑帮被抓之后，都是死不认帐，最终获释，因为他们很清楚法律：在没有证据的情况下，是没有理由治罪的。

很多问题的关键不在博弈而在于信息优势，信息的多寡和力量的高低才是决定性的。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

sunnygirl

2005-8-27 13:50:00

好东西

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

zhuangqian001

2005-8-27 18:53:00

晕..........

这个例子只是说明了一个分析事情的方法，你为什么会想到这件事情一定是在囚徒身上发生的。

你是否还想知道囚徒的名字、性别和国籍以判定事情的真实性？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

johnyj

2005-8-27 21:49:00

是的，这仅仅是一个例子而已。

只是，这个例子暴露出了博弈论经不起推敲的特点。这个理论对于参与者的智力水平有一个基本的限定，也就是说：不能太傻，又不能太聪明，必须刚好这么聪明。如果这个假设不成立，那么博弈的过程就远比博弈论提到的要复杂。

多重博弈已经看到了这一面：想的每深入一层，作出的判断就截然相反，正好印证了佛教中“佛心自现”的说法。

可以拿博弈论比较一下孙子兵法，看看哪个更高一筹。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

kennymb

2005-8-28 13:54:00

你这个例子并不能说明什么。在博弈论中开篇名义讲的很清楚，参与人的收益函数数值变化会影响博弈均衡结果。

第一张收益表是一个绝对优势策略均衡，只有唯一的囚徒困境结果。第二张收益表是个分级协调均衡，有三个均衡结果（包含一个混合均衡）。

你所说的力量高低，就反映在对参与人收益函数的变化上。

另外，博弈论证明了，信息多的一方并不一总意味着优势。想想单位分房，有个要求大房但又资格不够的职工是个非常冲动的人，放出话如果不满意就会拿刀砍人（往往这种都不是可置信威胁）。如果单位领导不知道这个信息，他就会把大房留给自己。相反，如果他知道这个信息，如果他无法判断此威胁是否可置信，他可能把大房分给职工。此时，信息对分房领导并不利。斯塔尔博格均衡和库诺均衡的区别也是说同一个例子。（参加张维迎：博弈论与信息经济学）

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

0614

2005-8-28 17:54:00

高明啊

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

alfred5273

2005-9-24 11:25:00

用了心，但用心不够！吹毛求疵。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

guodong

2005-9-25 11:31:00

个人看法：博弈论只是提供一种分析问题的工具，具体的模型建立在严格的假设下，提供一种衡量标尺。不要为了博弈而博弈。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

sungmoo

2005-9-26 18:36:00

这个例子就是把博弈改成包括警察的三方博弈了。博弈树整个变了。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

譬如朝露

2005-9-27 20:26:00

“囚徒困境”代表一种博弈的类型，当收益表中的数字对比关系发生改变的时候，博弈就不能再叫“囚徒困境”了，而是其他类型的博弈。

呵呵，还有人与偶争论过“囚徒困境”的假设条件不符合现行法律呢。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

libingfu

2005-9-27 21:20:00

楼主的50％从何而来？纳什均衡更一般的意义是说当博弈双方中的某一方不改变自己的策略时另一方也不会改变自己的策略，这一点应该没有问题吧？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

healthfish

2005-9-28 17:17:00

经济学只不过是建立在一系列假设

和前提上的而已。和现实的情况肯定有出入的。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

yongbuhui

2005-9-29 13:33:00

以下是引用guodong在2005-9-25 11:31:57的发言： 个人看法：博弈论只是提供一种分析问题的工具，具体的模型建立在严格的假设下，提供一种衡量标尺。不要为了博弈而博弈。

完全同意要得就是这种分析过程及分析方法和分析角度建立起来的思维土壤

[此贴子已经被作者于2005-9-29 13:34:24编辑过]

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

arhwa

2005-9-29 20:26:00

楼主对博弈的理解似乎有问题吧。

在完全信息静态博弈下的囚徒困境有时与现实不符合，博弈论专家早就意识到了，于是发展了完全信息动态博弈和不完全信息下对该问题的进一步的模型。楼主提到它们更多对犯罪新手有效，这可以认为是完全信息静态博弈的近似，对犯罪老手无效，这恰好是完全信息动态博弈的近似，因为他们可以通过实施“针锋相对策略”或者“萝卜－大棒策略”实现双方合作（即都选择抵赖）。另外还可以事前签订有效的和约来防止对方坦白，例如他们都属于一个黑帮，这个黑帮势力足够强大，谁坦白谁将被处死。这也可以说明它们对有组织犯罪或黑社会犯罪的无效。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

月夜逛犬

2005-10-1 11:48:00

这个例子也许不能说明什么！

但是有一句话很强：

很多问题的关键不在博弈而在于信息优势，信息的多寡和力量的高低才是决定性的。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

传教士

2005-10-1 13:22:00

你对博弈论的理解有很大问题！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

frogdan

2005-10-3 11:54:00

我同意楼主的看法，就是说我们经常想到的“我能猜到他猜到我猜到他猜到我猜到他.....在想些什么”。

有时候多想一层就会多复杂很多，囚徒困境还要看即使是两个聪明的匪徒他们的聪明程度是否一样，和警察的聪明程度是否一样。

不过纳什所说的这种情况应该目的只在于把人们带入博弈论的殿堂罢了，如果深究下去不也正是博弈论深邃和动人的地方吗？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

传教士

2005-10-4 20:06:00

老是突破别人的假设，然后找出别人的错误，搂主的想法是好的，但是她讲一个一次的静态博弈突破了，而且在肆无忌弹的改变前提！这样即使我们找出问题也没有可能变化找到我们自己的模型解释！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

kobySTDY

2005-10-4 21:04:00

楼主对囚徒困境中的战略表格进行表格从而引发新的思考这样的学习方法本人极其赞同,但在战略表格变的同时此博弈就不在是囚徒困境了,居不才所知在完全静态博弈中,以大的损人来达到小的利己,从而使整体利益为负的情况才是真正的囚徒困境,否则只是类囚徒困境而已,条件在理论的讨论上很重要,虽然这些条件或许现实中不一定满足