全部版块 我的主页
论坛 经济学论坛 三区 马克思主义经济学
1036 1
2017-01-17

    重复囚徒困境与单次博弈是不同的。单次博弈中选择背叛,对手将没有机会惩罚你。在现实生活中很容易找到这样的例子。通常居民区附近的餐馆订价合理,他们主要招徕回头客,面对的是重复博弈;而火车站、旅游景点附近的餐馆往往质次价高,因为他们的顾客流动性强,是单次博弈。

    如果重复囚徒困境博弈确定重复若干回合,那么最佳策略是在最后的回合背叛,反正你的对手没有机会报复你。开在小区附近的餐馆也有可能在预售了很多消费卡之后关门走人,这时候博弈游戏的最后一步是掌握在他们自己手里。

    为消除“最后一轮影响”,在阿克塞尔罗德组织的第二轮竞赛中,将每一步结束游戏的概率设定为0.0346,这样就没有人知道最后一步什么时候到来,博弈总次数变成随机的。

    如果重复博弈次数是固定的——比如20回合,会发生什么情况?最初,可能选择在第20回合背叛的策略会获得优胜,当大家都选择这一策略之后,就会出现选择在第19回合背叛的程序......这就变成了一个谁先撕破脸皮的游戏。那么是不是可以依次类推,从第一个回合就开始背叛是最佳策略呢?尽管这符合逻辑,但是违背直觉。哪怕是固定20回合,难道不是友善的策略更有可能赢得胜利吗?如果你对这个违背逻辑的直觉有所怀疑的话,不妨把回合数设定为200回合,你是否还会坚持从第一回合就开始背叛是最佳策略?这有点像“秃子悖论”,N+1式的依次类推不能滥用。

    在我看来,这些问题有点过于钻牛角尖。在真实的世界里,大多数情况下我们面对的是一个开放的环境。如果某个环境中的对手不太友善,我们难道不是选择离开这里去寻求与其他人合作吗?所以,自由选择是重要的。如果游戏能够设计成开放的,可以自由选择的环境,友善的策略就不会与“小人”策略进行长期的一报还一报的纠缠。

    此外,有一个容易被忽略的设定,就是在阿克塞尔罗德设计的这个博弈竞赛中,个体能够识别和记忆曾相遇的其他个体的行为,这才是促使合作行为出现的关键。如果人人都是健忘的,那么居民区与旅游景点附近的餐馆也不会有什么区别。于是,在真实的世界里,声誉具有了重要的意义。即使没有同他人进行过合作,我们也可以通过声誉了解他人的行为模式。

    有人说中国人的道德大约只有三十里,意思是说:传统农耕社会里的中国人,生活大致被拘限于家乡,方围三十里,乡里乡亲低头不见抬头见,所以中国人在自已的家乡不敢轻易违逆道德。走出家乡三十里外,认识的人少了,道德的约束力就减弱。日本也有“旅途丢丑不算丑”这样的谚语。但是在现代社会,商标、品牌、信用等等因素变得前所未有的重要起来,所以一个日本米店老板卖霉米事发后只能上吊自杀。

    过去被认为是单次博弈的场景,比如火车站、旅游景点附近的餐馆,只看一次的电影等等,如今我们也可以通过网络评分系统了解他们的信息。也就是说,在现代社会当中,人与人的联结变得更加紧密,并不存在真正意义上的单次博弈。我相信,在真实世界的开放环境中,友善策略获胜将变得更加容易。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-1-17 16:16:32
难道您不这样认为吗

许光伟 论中华所有制问题 [color=rgb(153, 153, 153) !important]
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群