全部版块 我的主页
论坛 经济学论坛 三区 博弈论
2009 3
2023-08-26

运用孙子兵法知己知彼思想

破解世界著名难题——囚徒困境

杨六省

yangls728@163.com

1. 囚徒困境的故事

囚徒困境是世界著名难题。自1950被提出以来,70多年过去了,这个难题迄今仍未得到解决。

故事情节是这样的:有两名嫌犯A和B被警方抓获,被分别关押在不同的房间里接受警方的盘问。他们被告知:如果一人认罪,另一人不认罪,认罪者可获释,不认罪者将获刑10年;如果两人都认罪,他们将均获刑5年;如果两人都不认罪,他们将均获刑1年。为便于分析和比较,我们用下面的表格来表示上述条款。

B   

    A

认罪

不认罪

认罪

5

5

10

0

不认罪

0

10

1

1

两人各会有怎样的盘算呢?

嫌犯A可能会这样想:假设B选择认罪,我若不认罪,将获刑10年,若认罪,只获刑5年,当然选择认罪有利;假设B选择不认罪,我若也不认罪,将获刑1年,我若认罪,则可获释,显然还是认罪有利。总之,不管对方选择认罪还是不认罪,认罪对我都是最佳选择。

同样,嫌犯B的盘算结果也是认为,选择认罪是最佳方案。

然而,由上述表格容易看出,两人都选择不认罪要好于两人都选择认罪,因为对前者而言,两人都只获刑1年,对后者而言,两人都获刑是5年。

上述这个与客观事实(指两个囚徒都应该选择不认罪的策略)相矛盾的推理结论(指两个囚徒都应该选择认罪的策略),就是著名的囚徒困境,也叫囚徒困境悖论。

2. 如果囚徒A不认罪,那么,囚徒B选择认罪策略是理性行为吗?

自从囚徒困境问题被提出以来,学界普遍认为,如果囚徒A选择不认罪的策略,那么,囚徒B选择认罪的策略就是一种理性行为。但是,笔者认为,这种认识是错误的,下面将给出解释。

孙子兵法曰:“知己知彼百战不殆。”意思是如果对敌我双方的情况都能了解透彻,打起仗来就不会有失败的危险。大凡每遇战事,双方事先都会进行实战推演(思想实验)。事实上,这就是双方在下一盘公开棋,不过,特别规则是可以悔棋。例如,囚徒A告诉囚徒B,他打算不认罪。B说,那我就选择认罪。这时,A说,我悔棋,我将不认罪改为认罪。这时,两人陷入反思……,最终达成共识,即两人都认罪不如两人都不认罪。于是,双方都决定悔棋,即都把认罪改为不认罪。结论是,如果囚徒A不认罪,那么,囚徒B也应该不认罪,这才是真正的理性行为——这就是中国成语所说的“大巧若拙”。

3. 两个囚徒博弈的最优解(正确答案)证明

马丁·苏比克悲观的写道(1970):“囚徒的困境这个难题是永远也解决不了的”。

笔者一直坚信马列主义的真理观——真理是可知的。据此,笔者认为,囚徒困境是可破解的。事实上,笔者曾对两个囚徒博弈的最优解给出过三种证法(参见:杨六省著《悖论是什么——70个悖论的消解》一书,武汉,汉斯出版社,2020年),但下面的新证明是活生生的,就像两人面对面下棋一样。

证明:①假设对方选择认罪的策略,很显然,我也应该选择认罪的策略。

假设对方选择不认罪的策略,如果我选择认罪的策略,对方会知道我的想法,并知道他将陷于最坏境地。由于做决策是同步思考的,所以,对方有权随时调整策略,也就是说,为了避免最坏情况的发生,对方必然会把原来的不认罪策略改为认罪策略——这时出现两人都认罪了但是,我很清楚,两人都认罪不如两人都不认罪。因此,假设对方选择不认罪的策略,那么,我也应该选择不认罪的策略。

③综上所述,无论对方选择什么策略,我都应该选择与对方相同的策略。对方也会这样想。简言之,两人的策略选择应该是一致的。

④如果我选择认罪的策略,则对方也会选择认罪的策略,但这显然不是最好的方案。对方也会这样想。

⑤于是,两人将不约而同地都选择不认罪的策略。(证完)

基于上述推演,囚徒困境这一世界著名难题就得以破解.了。

说明:本文内容来源于笔者新书《悖论:披着羊皮的狼——对99个悖论的消解》(线装书局出版社,2023.6)。在京东上搜索“悖论:披着羊皮的狼”或“杨六省”即可找到该书。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2023-8-26 19:37:11

感谢分享。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-8-29 16:33:18
囚徒困境是有先决条件的同学,大概是AB两个罪犯都是极具自私极具理性的,然后两个人中途不可以商量见面。他这个假设其实是针对资本主义市场环境下资本或者商业决策者的性格特点而设立的~~~下面的篇幅讨论的已经不是囚徒困境的问题模型了~~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-9-9 15:42:17
美国对华为的打压,犹如囚徒的推理,并不是理性行为——在遭到对方反击后,杀敌一千,自损一千,自己并没有捞到好处。合作双赢,打压损人不利己。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群