全部版块 我的主页
论坛 经济学论坛 三区 博弈论
12983 37
2005-08-26

囚徒困境博弈

---------------------------------------------------------------- 塔克是从这样一个小故事开始的:两个夜贼,鲍伯(Bob)和艾尔(Al),在行窃现场附近被抓获并被警方隔离拷问。每个夜贼都必须选择是否坦白和揭发对方。如果两个贼都不坦白,他们都将被判刑一年。如果每个贼都坦白并揭发对方,他们都将在监狱中度过10年。但是,如果一个贼坦白并揭发对方,而另一个贼不坦白,那么与警方合作的贼将被释放而另一个贼将在监狱中度过20年。 在这个例子中的战略是:坦白与不坦白。赢利(payoff)(实际上是处罚)是判刑。我们可以用“赢利表(payoff table) ”简洁地表达上述信息,这类赢利表已经成为博弈论中很好的标准表达式。以下是囚徒困境博弈的赢利表。 表2-1              艾尔            坦白   不坦白 鲍伯   坦白   10,10   0,20      不坦白  20,0    1,1 这个表的读法是这样的:每个囚犯从两个战略中选择一个。即,艾尔选择一列,鲍伯选择一行。每个单元格的两个数字告诉两个囚犯相应的战略被选择后的结果。逗号左边的数字表示选择行的人(鲍伯)的赢利,逗号右边的数字表示选择列的人(艾尔)的赢利。因此(先阅读第一列),如果他们都选择坦白,每人将判刑10年,但是如果艾尔坦白而鲍伯不坦白,鲍伯被判20年而艾尔将被释放。 那么:怎样求解这个博弈?如果双方都想使自己呆在监狱的时间最短,他们选择什么战略是“理性的”?艾尔可能会做这样的推理:“两种事件可能发生:鲍伯要么坦白要么保持沉默。假定鲍伯坦白,我不坦白的话将被判20年,我也坦白的话则判10年。另一方面,如果鲍伯不坦白,我不坦白我被判刑1年,但在这种情况下,如果我坦白我可以被释放。无论怎样,我选择坦白都是最好的。因此,我将坦白。” 但是鲍伯能够而且大概也将做同样的推理——因此他们都将坦白并且都在监狱呆10年。然而,如果他们“不理性”地行动,都保持沉默,他们都可以在1年后被释放。 -----------------------------------------------------------------------------------------------

对于这个经典案例,很早就有人分析过,博弈论成立的基础是把别人当作傻瓜。那张赢利表是问题的关键:

             艾尔            坦白   不坦白 鲍伯   坦白   10,10   0,20      不坦白  20,0    1,1

根据这张表,我们假设囚犯会概率论(尽管这是比较荒唐的),以艾尔为例,可以看到如果选择坦白一列,可能的结果是10X50%+0X50%=5年,而不坦白一列,结果是20X50%+1X50%=10.5年。如果他会概率论,他就会选择坦白。可问题是他如果不会概率论呢?

又,假设警察告诉他们的是另一张表:

             艾尔            坦白   不坦白 鲍伯   坦白   20,20    0,10      不坦白  10,0    1,1

显然这时候两个人的选择都是不坦白,因为不坦白那一列的可能囚禁年数较少。

因此这张表才是问题的关键,作为会概率论的罪犯,他们的选择完全取决于这张表。因此对于象纳什那样既天真而又会概率论的囚徒,警察可以任意使用不同的表来获得自己想要的回答。

但事实是,这套把戏只能对付新手。稍微老道一点的囚徒,都会意识到这张表是问题的关键,在他们被捕之前,肯定已对于这张表或者说法律的程序了如指掌,因此无论警察如何套供,肯定是拒不承认。这一点,可以在众多香港影片中看到:黑帮被抓之后,都是死不认帐,最终获释,因为他们很清楚法律:在没有证据的情况下,是没有理由治罪的。

很多问题的关键不在博弈而在于信息优势,信息的多寡和力量的高低才是决定性的。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2005-8-27 13:50:00
好东西
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2005-8-27 18:53:00

晕..........

这个例子只是说明了一个分析事情的方法,你为什么会想到这件事情一定是在囚徒身上发生的。

你是否还想知道囚徒的名字、性别和国籍以判定事情的真实性?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2005-8-27 21:49:00

是的,这仅仅是一个例子而已。

只是,这个例子暴露出了博弈论经不起推敲的特点。这个理论对于参与者的智力水平有一个基本的限定,也就是说:不能太傻,又不能太聪明,必须刚好这么聪明。如果这个假设不成立,那么博弈的过程就远比博弈论提到的要复杂。

多重博弈已经看到了这一面:想的每深入一层,作出的判断就截然相反,正好印证了佛教中“佛心自现”的说法。

可以拿博弈论比较一下孙子兵法,看看哪个更高一筹。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2005-8-28 13:54:00

你这个例子并不能说明什么。在博弈论中开篇名义讲的很清楚,参与人的收益函数数值变化会影响博弈均衡结果。

第一张收益表是一个绝对优势策略均衡,只有唯一的囚徒困境结果。第二张收益表是个分级协调均衡,有三个均衡结果(包含一个混合均衡)。

你所说的力量高低,就反映在对参与人收益函数的变化上。

另外,博弈论证明了,信息多的一方并不一总意味着优势。想想单位分房,有个要求大房但又资格不够的职工是个非常冲动的人,放出话如果不满意就会拿刀砍人(往往这种都不是可置信威胁)。如果单位领导不知道这个信息,他就会把大房留给自己。相反,如果他知道这个信息,如果他无法判断此威胁是否可置信,他可能把大房分给职工。此时,信息对分房领导并不利。斯塔尔博格均衡和库诺均衡的区别也是说同一个例子。(参加张维迎:博弈论与信息经济学)

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2005-8-28 17:54:00
高明啊
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群