摆脱囚徒困境 ——基于制度设计的视角

9411

收藏 2011-11-04

【摘要】囚徒困境问题存在于人类生产生活的各个方面，它成为了社会科学研究的重要领域之一，但对于如何解决囚徒困境问题，我们还缺乏深入的研究。本文在对已有研究进行分析的基础上，深入探讨了生活中的两个囚徒困境例子“公交车博弈”和“学生食堂就餐博弈”，通过“制度设计”这一视角分析解决囚徒困境的方法——改变博弈规则，并延伸讨论了“文明进步”和“环境保护”的问题。

【关键词】囚徒困境；制度设计；文明进步；环境保护

几乎每本博弈论的教科书都要涉及“囚徒的困境”博弈，这对于初学者理解博弈的策略相关性及个体理性与集体理性的冲突很有帮助。该博弈是1950年图克（tucker）提出的，基本的模型内容在这里不再赘述，最终的结果也是我们熟知的：囚徒均选择“ 坦白”的策略。这对于他们来说是上策（Dominant Strategy），由于这种结果既没有实现两人总体的最大利益，也没有真正实现自身的个体最大利益，而且结果具有必然性，很难摆脱，因此这个博弈被称为“囚徒的困境”。尽管，该模型“在社会经济活动中具有很大的普遍性，在市场竞争的各个领域和方面，在资源利用和环境保护，以及政治、军事和法律各领域问题中，都存在类似囚徒的困境现象。”【1】但教科书上对其的解决——或者分析——通过纳什均衡找寻博弈的均衡策略，并没有真正解决囚徒困境问题。在将博弈拓展到无限次重复博弈，才有改善双方受益的可能性，这对于经济效率来说并不是件好事。一、解决囚徒困境问题的已有研究一些学者对于解决囚徒困境问题进行了一些探索，桂林、邓宁（2009）认为人们的行为具有外部性，囚徒困境是其形象的表达，他们研究了在政治学、法学和经济学中的囚徒困境问题，并总结了学者的提出的各种机制和方法，“如重复博弈和声誉机制、庇古税、科斯讨价还价、剩余索取权配置以及产权配置、选择性激励等”【2】。冯浩文（2009）讨论了两个生活中的博弈“交警与公交司机博弈”、“小贩城管博弈”，并针对问题提出“交通设施上引进电子设备”和“城市管理中树立以人为本的观念”等【3】。李迎春（2010）针对图书馆占座问题，提出解决困境的关键在于“利用相关技术设计管理系统”和“加大监督力度”等。对于中小企业融资中出现的囚徒困境问题【4】，孙凤茹（2009）经过分析得出加强信用评价体系建设的结论【5】。张志明（2009）通过对校园不良现象的囚徒困境反思，提出要大力开展诚信教育和人格教育【6】。肖微、方堃（2009）对政府和企业的关系如何从囚徒困境博弈转化到智猪博弈分析了政府应该做出的努力【7】。综观这些研究，学者们对解决囚徒困境的思路不断拓展，可以概括分类为“加强博弈方的教育，增强诚信”、“引入第三方，降低信息不对称”、“改变某博弈方行为转化为合作博弈”等等，我们认为囚徒困境的原因在于博弈双方的互不信任，而解决双方的信任问题是件困难的事情，当博弈方无法通过自己的行为改善得益时，我们想到了改变博弈规则的方法。“要建立起双方对等的信息流通，这就需要有一个第三方独立、公正的角色出现，平衡双方的利益，传递双方的信息，同时也制约双方的非理性选择”【8】。本文将使用“制度设计”的概念，通过该视角，进行改变原有的囚徒得益的尝试，以期摆脱囚徒困境。本文将分析生活中的两个囚徒困境的例子“公交车博弈”和“学生食堂博弈”，并给出摆脱囚徒困境的方法，在开始这些讨论前，本文将进行一些必要的假定，这将有利于我们的讨论：假定一：资源的稀缺性。资源的稀缺性一直困扰着经济学家，或者说经济学就是研究资源稀缺性问题的，研究资源有限的约束条件下追求最大效用的问题。假定二：人是基本经济理性的。理性人的假设是西方经济学的基础，也是我们能顺利讨论问题的关键，我们并不要求人是完全理性的，我们只认为他们可以对激励做出适当的反应。假定三：服务的提供方乐于改善其服务质量。服务的提供方是我们讨论博弈问题的又一主体，它决定了博弈的基本规则，因而是制度设计的主体。满足了这些基本的假定我们便可进行下面的谈论了。二、公交车博弈我们都有过这样的经历，在等公交车时，尤其是很多人一起等车的时候，上车时大家很容易出现一拥而上的局面，为了保证先机，很多人站在远离站牌的位置。我们都曾为此苦恼，但自己也不知不觉成了挤车的人，这种心理很容易理解：我不挤，而别人挤的话，我就有可能没有座位，甚至会坐不上车，往往后者的忧虑多一些（我国人口众多的原因）。这是一个典型的囚徒困境问题，我们都想尽早上车，结果是大家挤车浪费了很多时间，而且造成很大的拥挤成本（包括不良的社会影响）。现在我们假设有两个博弈方，博弈方一和博弈方二，两者都有挤和不挤这两种策略，我们有如下的得益矩阵。

	挤车	不挤
挤车	0.5 ，0.5	2 ， 0
不挤	0 ， 2	1 ， 1

公交车博弈得益矩阵（1）    在双方都不挤的情况下，双方的收益为1，即双方都能有效率、先来后到地上车；当有一方选择不挤时，另一方选择拥挤可以获得全部的收益，不仅坐上车，而且节约了自己的时间，得益为2，不挤的一方面临着排队的不公平和上不了车的风险，因而得益为0，或者接近0；当双方都挤的情况下，虽然双方都可以上车，但有一定的拥挤成本，有时还很大，得益假设为0.5，根据纳什均衡的分析，该博弈存在纯策略纳什均衡，即“挤，挤”，博弈双方陷入囚徒困境中。产生囚徒困境的原因首先是公交车有限而等车的人很多，双方理性的选择便是挤车，这里暂且不谈文明程度的问题。但有一点我们是可以知道的，很多人虽然是愿意排队的，但在这样的得益情况下，制度要求人们不得不去挤车。因此我们也明白了产生该困境的原因是错误的机制设计，那么我们是否可以通过改变搭公车制度来改变博弈双方的收益，进而摆脱囚徒困境呢？该博弈中博弈规则的制定者，即服务提供方是公交公司，理论上有三个改变博弈规则的办法改善其服务质量：一个是建立排队的铁栅栏，二是安排专门人员进行秩序维护，第三个方法很简单，即在公交车的前门上贴上如“不排队不开门”的标语。建立铁栅栏的方法可以诱导人们排队，但在公路上铁栅栏会影响部分交通，其次是成本太高。而安排专门人员又会产生一系列的纠纷，普通人员没有进行秩序维护的权威性。相比之下，第三个方法具有更深刻的制度含义，它会显著改变博弈方的得益情况，加入该制度约束后，得益矩阵将发生改变，如下图：
挤车
不挤
挤车
0 ，0
-1  ，  0
不挤
0  ，-1
1  ， 1
                        公交车博弈得益矩阵（2）在有制度的规定下，双方挤车的得益为零，因为公交车司机有维护秩序的权威性，不开门则谁也上不去；如果双方都不挤，都可以有秩序而且先来后到地上车，双方获得的收益为1；若一方挤，另一方不挤，挤的一方会受到人们的鄙视，虽然其仍有可能上车，但其收益已是负的（人们追求的得益不仅是物质的）。通过这样的改变，我们不难发现其纳什均衡已经发生了变化（不挤，不挤），可以说已经解决了囚徒困境的问题。而现实中不存在这样的结论是因为我们假设的第三条不满足，公交公司并没有激励提高其服务质量。该模型还可以用于分析公交车的另一问题，即车上人多时，站着的人总是不往车后走，导致了有些候车的人上不了车。更多的人上车会造成车厢更拥挤虽然可以解释一部分原因，但更加明显的原因是车的后门都在公交车的中部，想下车的乘客自然会堵在门口，以保障自己下车的先机，北京市一些公交车有两个后门，一个在车的中部，一个在尾部，这样的车上一般就不存在这样的问题。从公交车博弈的实例中我们可以发现文明的进步中存在“劣币驱逐良币”的问题，即当不文明的行为比文明的行为有更多的收益时，这会诱使很多人放弃原先文明的行为。正如我们在最优反应动态的进化博弈中看到的那样，之所以选择帕累托最优的人数越来越多，是因为帕累托最优的选择给博弈方带来了更多的利益。可能当文明发展到一定程度，这些原先支持文明发展的利益激励不存在了，文明依旧有效，但文明的发展初期，必须给文明的行为更多的收益补偿才能促使文明的进步，如何来保障呢？那就是制度进步，制度的进步使得一些规范渐渐为人接受，改变了人们进行博弈的收益情况，文明的行为给人们带来了大于不文明行为的收益时，文明便产生了，而制度不是其他，它是一个个商品或服务的提供方不断改进其服务质量的结果，“业已建立起来的秩序，由此所有的事物均被调规着”，哈耶克主张“行动的秩序”是建立在“规则系统”基础上的。行动的秩序被规则调节着，这个规则就是“制度”。制度不仅包括正式制度，如产权、契约和法律，而且包括非正式制度，如习惯、习俗和惯例，按照韦森（2001）的理解，制度是从“个人的习惯→群体的习俗→习俗中硬化出来的惯例规则→制度”这样一个动态的逻辑发展过程。 “当然，在研究过程中除了重视研究正式制度对解决囚徒困境作用外，还必须重视非正式制度如文化、习俗、价值观对囚徒困境解的意义，如利他精神对于减轻囚徒困境问题的作用等。对于囚徒困境问题，非正式制度也将会成为研究的重要领域。”【9】

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

flicon

2011-11-4 17:54:03

三、学生食堂就餐博弈
在学生食堂就餐经常碰到这样的困境，去得晚的话不仅饭菜是凉的，而且找不到干净的餐桌。为了讨论问题的方便，我们假设每天去食堂吃饭的人是100人，食堂共有就餐位40个，这就说明至少有一张桌子是被重复利用的，问题正是产生与此。我们将就餐学生分为前者和后者，不难发现该博弈是一个完全且完美信息的动态博弈，但有其特殊的地方，即前者的决策对后者有影响，而后者的决策却不影响前者的收益。我们用拓展形来描述这一博弈，如右图。
我们依然假设博弈双方1和2，双方有两种选择，即扔与不扔，扔即挑出不喜欢吃的食物，扔掉吃饭产生的各种废物等，无论如何，会弄脏餐桌，但博弈方1是先来者，若其扔，可获得2的得益，不扔，却要为此付出成本，如小心翼翼不弄脏餐桌，捡拾自己吃饭的垃圾等，收益降为1，博弈方2的决策不会影响1的收益，在脏餐桌就餐，效用减少，扔得得益为1，不扔为0.5，干净的餐桌上得益如博弈方1，因此从模型分析，博弈方均有弄脏餐桌的冲动。
该博弈持续进行的后果是显而易见的，后来者面临着就餐环境变差的问题，这不属于传统意义上的囚徒困境，但由于其具备结果的不可改变和个人理性造成集体效益变差的特征，我们仍认为其存在囚徒困境，餐桌越来越差的结果是我们不想看到的。奥尔森（olsen）在其名著《集体行动的逻辑》中论述产生“许多合乎集体利益的集体行动并没有发生。相反地，个人自发的自利行为往往导致对集体不利、甚至产生极其有害的结果”的原因，“集体行动的成果具有公共性，所有集体的成员都能从中受益，包括那些没有分担集体行动成本的成员。”因而正如本例中看到的，别人不收拾自己收拾餐桌也没有多大好处，因而导致了餐桌越来越脏的局面。
与“公交车博弈”相同，该博弈也要从制度设计的角度分析，这里即为食堂管理者改变博弈规则，第一种改变博弈规则的方法是斩断博弈前后者的联系，这需要雇佣专门的服务员，对餐桌进行及时的清理，这也是普通的小餐馆的做法，但我们可以采取成本更小的办法——给每位就餐者发放餐盘，其实我们也想到了贴标语的方法，但由于缺乏像公交车司机那样的监督者，标语必然是没有制度约束力的，给每个人发放餐盘，这就降低了“不扔”的成本，虽然仍然有同学有扔的习惯，但从整体上看餐桌上垃圾的数量将会大大减少，相比于请新雇员，这种方法的成本低得多。
其实“食堂就餐博弈”可以在很多地方看到它的例子，比如“公共厕所不冲洗的问题”、“公共教室有很多垃圾问题”，“车站旁边的东西卖得贵的问题”等等，都是因为“后者”对前者的决策不造成影响，即使有影响，也不是直接的、即时的。我们常常遇到这些问题，靠博弈方无法解决，只能靠服务的提供方改变规则来解决。
该博弈模型的更大应用是在环境保护领域，我们常常考察当今各大国在环境保护中的博弈，而常常忽略了环境的纵向影响，从纵向来看，我们的前者，即前辈，在发展那一代经济时是否破坏环境对于我们的决策没有任何依赖性，一直以来环境保护只能靠良心，当一件事情只能依靠良心时就容易产生问题。这里的服务提供方是大自然，但给予其约束——必须发展经济——的制度却是人为的。自从发明了GDP以后，官员的升迁便很大程度上依赖于此，各时期总追求比前一时期更加进步，不发展便不会得到升迁，整个社会弥漫着成功强迫症，即我们对“失败”缺乏宽容，这样的约束下只能使环境问题越来越严重。
回到我们最开始的囚徒困境的例子，它的解决方法是极其简单的，改变博弈规则，警察将他们关到同一件房间共同审问这样的制度设计便摆脱了囚徒的困境。
四、结语
通过我们的讨论，我们得出摆脱囚徒困境可以从制度设计的视角，它通过改变博弈规则，进而影响博弈方的得益，改变博弈方的行为。
而博弈规则的提供可以是具体的，如食堂的餐盘提供，可以是宏观的，涉及到文明进步，环境保护，当然需要制度的规定，除了正式的制度，也要注重非制度的建设。制度是为规范人们行为存在的，邓小平曾说过：坏的制度能使好人做坏事，好的制度能使坏人不得不做好事。通过分析，我们看到了坏制度如何让好人做了坏事，但好制度要使坏人不得不做好事，那也是很困难的，即使可以做到，也将付出很大的成本，所以，一套好的制度不一定要使得所有人都做好事，但起码会保证好人不受坏人的影响，因为做好人的收益高，根据进化博弈论的观点，社会上做好人的比例将会越来越大。
参考文献：
[1]谢识予. 经济博弈论（第二版）[M]. 上海：复旦大学出版社，2002年：8.
[2]桂林、邓宁. 社会科学中的囚徒困境现象及其解[J] . 当代经济研究，2009（5）：24-26.
[3]冯浩文. 囚徒困境及其破解策略在日常工作中的应用举例[J]. 企业技术开发，2009（28）：91-93.
[4]李迎春. 囚徒困境与高校图书馆占座现象[J]. 农业图书情报学刊，2010（2）：178-179.
[5]孙凤茹. 囚徒困境 —中小企业融资信用维度研究[J]. 学术论丛，2009（39):52-53.
[6]张志明. 破解囚徒困境促进校园和谐[J]. 科教文汇，2009（上旬刊）：4-10.
[7]肖微、方堃. 基于博弈论思维框架的政府与企业关系重塑——从 “囚徒困境” 到 “智猪博弈”的策略选择[J].华中农业大学学报（社会科学版），2009（1）:60-63.
[8]刘霞.走出囚徒困境[N],中国质量报,2009 -04 -8(8).
[9] 桂林、邓宁. 社会科学中的囚徒困境现象及其解[J] . 当代经济研究，2009（5）：24-26.
Get Rid of The Prisoner's Dilemma
——through the perspective of "system design"

Abstract：The Prisoner's Dilemma exist in many aspacts of human beings ' life , it has been one of the most important fields social science research on , but we still lack of in-depth research on revolving The Prisoner's Dilemma . based on the analysis of the existing research , this paper probes into two prisoners' dilemma example in ordinary life——"Bus game" and "Student canteen game" , and draw a conclusion that a solution to the problem through the perspective of "system design" is changing the rules of the game. What's more , this paper provides extended discussion about The Civilization and progress and The environment protection .
Key words：The Prisoner's Dilemma system design The Civilization and progress The environment protection

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

flicon

2011-11-4 17:54:51

自己写的学年论文，大家多捧场啊

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

笙箫作别

2011-11-4 19:18:58

lz，我想提个问题，就是所谓公交排队的问题。你说如果拥挤，挤的人受到鄙视所以效用为-1，我觉得这个不一样。如果真的在乎周围人的目光，很多人在现有制度下也不会插队；如果真的能做到插队，恐怕多数也是油盐不进的人。看看上海的地铁和杭州的公交，我觉得油盐不进的人绝非这种社会微弱谴责所能制止。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

flicon

2011-11-4 20:37:50

笙箫作别发表于 2011-11-4 19:18
lz，我想提个问题，就是所谓公交排队的问题。你说如果拥挤，挤的人受到鄙视所以效用为-1，我觉得这个不一样 ...

谢谢提问，拥挤的人遭受鄙视是制度改革后的情况，即“公交车贴出不排队不开门”字样，这样一个人的自私行为影响其他人的利益，必然会遭到人们的鄙视。而现有的情况却没有给人们明确的禁止提示，只是有抽象的道德限制，因而无法达到排队的结果，造成文明人不文明的行为。欢迎继续探讨啊O(∩_∩)O~

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

titanmgb

2011-11-9 19:15:25

论文赶紧投

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群