【摘要】囚徒困境问题存在于人类生产生活的各个方面,它成为了社会科学研究的重要领域之一,但对于如何解决囚徒困境问题,我们还缺乏深入的研究。本文在对已有研究进行分析的基础上,深入探讨了生活中的两个囚徒困境例子“公交车博弈”和“学生食堂就餐博弈”,通过“制度设计”这一视角分析解决囚徒困境的方法——改变博弈规则,并延伸讨论了“文明进步”和“环境保护”的问题。
【关键词】囚徒困境;制度设计;文明进步;环境保护
几乎每本博弈论的教科书都要涉及“囚徒的困境”博弈,这对于初学者理解博弈的策略相关性及个体理性与集体理性的冲突很有帮助。该博弈是1950年图克(tucker)提出的,基本的模型内容在这里不再赘述,最终的结果也是我们熟知的:囚徒均选择“ 坦白”的策略。这对于他们来说是上策(Dominant Strategy),由于这种结果既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,而且结果具有必然性,很难摆脱,因此这个博弈被称为“囚徒的困境”。尽管,该模型“在社会经济活动中具有很大的普遍性,在市场竞争的各个领域和方面,在资源利用和环境保护,以及政治、军事和法律各领域问题中,都存在类似囚徒的困境现象。”【1】但教科书上对其的解决——或者分析——通过纳什均衡找寻博弈的均衡策略,并没有真正解决囚徒困境问题。在将博弈拓展到无限次重复博弈,才有改善双方受益的可能性,这对于经济效率来说并不是件好事。一、解决囚徒困境问题的已有研究一些学者对于解决囚徒困境问题进行了一些探索,桂林、邓宁(2009)认为人们的行为具有外部性,囚徒困境是其形象的表达,他们研究了在政治学、法学和经济学中的囚徒困境问题,并总结了学者的提出的各种机制和方法,“如重复博弈和声誉机制、庇古税、科斯讨价还价、剩余索取权配置以及产权配置、选择性激励等”【2】。冯浩文(2009)讨论了两个生活中的博弈“交警与公交司机博弈”、“小贩城管博弈”,并针对问题提出“交通设施上引进电子设备”和“城市管理中树立以人为本的观念”等【3】。李迎春(2010)针对图书馆占座问题,提出解决困境的关键在于“利用相关技术设计管理系统”和“加大监督力度”等。对于中小企业融资中出现的囚徒困境问题【4】,孙凤茹(2009)经过分析得出加强信用评价体系建设的结论【5】。张志明(2009)通过对校园不良现象的囚徒困境反思,提出要大力开展诚信教育和人格教育【6】。肖微、方堃(2009)对政府和企业的关系如何从囚徒困境博弈转化到智猪博弈分析了政府应该做出的努力【7】。综观这些研究,学者们对解决囚徒困境的思路不断拓展,可以概括分类为“加强博弈方的教育,增强诚信”、“引入第三方,降低信息不对称”、“改变某博弈方行为转化为合作博弈”等等,我们认为囚徒困境的原因在于博弈双方的互不信任,而解决双方的信任问题是件困难的事情,当博弈方无法通过自己的行为改善得益时,我们想到了改变博弈规则的方法。“要建立起双方对等的信息流通,这就需要有一个第三方独立、公正的角色出现,平衡双方的利益,传递双方的信息,同时也制约双方的非理性选择”【8】。本文将使用“制度设计”的概念,通过该视角,进行改变原有的囚徒得益的尝试,以期摆脱囚徒困境。本文将分析生活中的两个囚徒困境的例子“公交车博弈”和“学生食堂博弈”,并给出摆脱囚徒困境的方法,在开始这些讨论前,本文将进行一些必要的假定,这将有利于我们的讨论: 假定一:资源的稀缺性。资源的稀缺性一直困扰着经济学家,或者说经济学就是研究资源稀缺性问题的,研究资源有限的约束条件下追求最大效用的问题。 假定二:人是基本经济理性的。理性人的假设是西方经济学的基础,也是我们能顺利讨论问题的关键,我们并不要求人是完全理性的,我们只认为他们可以对激励做出适当的反应。 假定三:服务的提供方乐于改善其服务质量。服务的提供方是我们讨论博弈问题的又一主体,它决定了博弈的基本规则,因而是制度设计的主体。 满足了这些基本的假定我们便可进行下面的谈论了。二、公交车博弈 我们都有过这样的经历,在等公交车时,尤其是很多人一起等车的时候,上车时大家很容易出现一拥而上的局面,为了保证先机,很多人站在远离站牌的位置。我们都曾为此苦恼,但自己也不知不觉成了挤车的人,这种心理很容易理解:我不挤,而别人挤的话,我就有可能没有座位,甚至会坐不上车,往往后者的忧虑多一些(我国人口众多的原因)。这是一个典型的囚徒困境问题,我们都想尽早上车,结果是大家挤车浪费了很多时间,而且造成很大的拥挤成本(包括不良的社会影响)。现在我们假设有两个博弈方,博弈方一和博弈方二,两者都有挤和不挤这两种策略,我们有如下的得益矩阵。
| 挤车 | 不挤 |
挤车 | 0.5 ,0.5 | 2 , 0 |
不挤 | 0 , 2 | 1 , 1 |
公交车博弈得益矩阵(1) 在双方都不挤的情况下,双方的收益为1,即双方都能有效率、先来后到地上车;当有一方选择不挤时,另一方选择拥挤可以获得全部的收益,不仅坐上车,而且节约了自己的时间,得益为2,不挤的一方面临着排队的不公平和上不了车的风险,因而得益为0,或者接近0;当双方都挤的情况下,虽然双方都可以上车,但有一定的拥挤成本,有时还很大,得益假设为0.5,根据纳什均衡的分析,该博弈存在纯策略纳什均衡,即“挤,挤”,博弈双方陷入囚徒困境中。 产生囚徒困境的原因首先是公交车有限而等车的人很多,双方理性的选择便是挤车,这里暂且不谈文明程度的问题。但有一点我们是可以知道的,很多人虽然是愿意排队的,但在这样的得益情况下,制度要求人们不得不去挤车。因此我们也明白了产生该困境的原因是错误的机制设计,那么我们是否可以通过改变搭公车制度来改变博弈双方的收益,进而摆脱囚徒困境呢? 该博弈中博弈规则的制定者,即服务提供方是公交公司,理论上有三个改变博弈规则的办法改善其服务质量:一个是建立排队的铁栅栏,二是安排专门人员进行秩序维护,第三个方法很简单,即在公交车的前门上贴上如“不排队不开门”的标语。建立铁栅栏的方法可以诱导人们排队,但在公路上铁栅栏会影响部分交通,其次是成本太高。而安排专门人员又会产生一系列的纠纷,普通人员没有进行秩序维护的权威性。相比之下,第三个方法具有更深刻的制度含义,它会显著改变博弈方的得益情况,加入该制度约束后,得益矩阵将发生改变,如下图:
| 挤车 | 不挤 |
挤车 | 0 ,0 | -1 , 0 |
不挤 | 0 ,-1 | 1 , 1 |
公交车博弈得益矩阵(2) 在有制度的规定下,双方挤车的得益为零,因为公交车司机有维护秩序的权威性,不开门则谁也上不去;如果双方都不挤,都可以有秩序而且先来后到地上车,双方获得的收益为1;若一方挤,另一方不挤,挤的一方会受到人们的鄙视,虽然其仍有可能上车,但其收益已是负的(人们追求的得益不仅是物质的)。通过这样的改变,我们不难发现其纳什均衡已经发生了变化(不挤,不挤),可以说已经解决了囚徒困境的问题。而现实中不存在这样的结论是因为我们假设的第三条不满足,公交公司并没有激励提高其服务质量。 该模型还可以用于分析公交车的另一问题,即车上人多时,站着的人总是不往车后走,导致了有些候车的人上不了车。更多的人上车会造成车厢更拥挤虽然可以解释一部分原因,但更加明显的原因是车的后门都在公交车的中部,想下车的乘客自然会堵在门口,以保障自己下车的先机,北京市一些公交车有两个后门,一个在车的中部,一个在尾部,这样的车上一般就不存在这样的问题。 从公交车博弈的实例中我们可以发现文明的进步中存在“劣币驱逐良币”的问题,即当不文明的行为比文明的行为有更多的收益时,这会诱使很多人放弃原先文明的行为。正如我们在最优反应动态的进化博弈中看到的那样,之所以选择帕累托最优的人数越来越多,是因为帕累托最优的选择给博弈方带来了更多的利益。可能当文明发展到一定程度,这些原先支持文明发展的利益激励不存在了,文明依旧有效,但文明的发展初期,必须给文明的行为更多的收益补偿才能促使文明的进步,如何来保障呢?那就是制度进步,制度的进步使得一些规范渐渐为人接受,改变了人们进行博弈的收益情况,文明的行为给人们带来了大于不文明行为的收益时,文明便产生了,而制度不是其他,它是一个个商品或服务的提供方不断改进其服务质量的结果,“业已建立起来的秩序,由此所有的事物均被调规着”,哈耶克主张“行动的秩序”是建立在“规则系统”基础上的。行动的秩序被规则调节着,这个规则就是“制度”。制度不仅包括正式制度,如产权、契约和法律,而且包括非正式制度,如习惯、习俗和惯例,按照韦森(2001)的理解,制度是从“个人的习惯→群体的习俗→习俗中硬化出来的惯例规则→制度”这样一个动态的逻辑发展过程。 “当然,在研究过程中除了重视研究正式制度对解决囚徒困境作用外,还必须重视非正式制度如文化、习俗、价值观对囚徒困境解的意义,如利他精神对于减轻囚徒困境问题的作用等。对于囚徒困境问题,非正式制度也将会成为研究的重要领域。”【9】