全部版块 我的主页
论坛 经济学论坛 三区 博弈论
5418 6
2006-09-30

四)量子博弈论——“囚徒困境”

“囚徒困境”是经典博弈论中的一个极富代表性的一个著名例子。这个例子的创造

本身就奠定了非合作博弈论的理论基础,并且它可以作为实际生活中许多现象的一

个抽象概括。

囚徒困境讲的是两个嫌疑犯(AliceBob)作案后被警察抓住,被分别关在不同的

屋子里审讯。他们每个人都有两种选择(策略):坦白(Defect,策略D)和抵赖

Cooperate,策略C)。警察告诉他们:如果两人都坦白,各判刑4年(收益均为

);如果两个都抵赖,因证据不足,各判刑2年(收益均为 )。如果其中一人坦

白,另一人抵赖,坦白地放出去(收益为 ),抵赖的判刑5年(收益为 )。

两个人的目的都是尽可能的是自己的收益最大化。在这个博弈中,坦白(D)是占

优策略(dominant strategy),也就是说,不论对方的选择是什么,个人的最优

选择是坦白。比如说,如果Bob抵赖,Alice坦白的话被放出来,抵赖的话被判2

;如果Bob坦白,Alice坦白的话被判4年,抵赖的话被判5年。所以,Alice的占优

策略是坦白,Bob的占优策略也是坦白。结果,理性的推理将迫使每个人选择坦白

,而显然此时两人的收益要比他们都选择抵赖时差。用博弈论的术语讲,策略组合

(坦白,坦白)是一个Nash均衡:任何单方面的偏离该策略组合都不能使得偏离者

的收益提高;当一个参与人选择坦白时,另一个参与人只有选择坦白才能使自己的

收益最大化。这也正是囚徒的“困惑”之所在。

1999年的《Physical Review Letters》里的一篇文章中J. Eisert等人研究了“

囚徒困境”的量子化的模型 [Phys. Rev. Lett. 83, 3077 (1999)]。这个模型由

以下三部分组成:(1)一个两比特产生源,每一个参与人拥有一个比特;(2)参

与人的操作装置,允许参与人操作属于他自己的那一个比特,这些操作实际上就是

参与人的策略;(3)一套测量装置,通过测量两个比特的最终状态已决定每一位

参与人的收益值。每一个参与人都十分清楚这三部分(比特源、每个人的操作装置

、最终的测量装置)。

他们仔细研究了这个量子化的“囚徒困境”,发现如果这个博弈中量子纠缠为零,

那么整个量子博弈将回到经典博弈;而当博弈处于最大纠缠时,出现了一个新的

Nash均衡,在这个均衡下,AliceBob的收益都是3,这样一来,在经典博弈中困

扰着博弈者的“困境”便不复存在。此外,如果Bob只采用经典策略而Alice采用量

子策略,则Alice总是能获得比Bob更高的收益。

这个工作以后,量子博弈得到了更加广泛的重视,越来越多的工作涌现出来,并展

现出量子博弈在许多方面的奇特性质。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2006-10-7 16:08:00
怎么都要这么贵啊
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2006-10-8 00:22:00
....好贵.....
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2006-10-10 00:39:00

囚徒困境上课听过了~~~

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2006-10-14 00:25:00

在网站找下就可以了.

觉得两个都会不忍心错过减刑的机会.自己都会往自己利益最大的方向思考.

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2006-10-17 16:35:00
不错啊~~~~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群