
8.B占优策略和劣策略
(不知道为何起这个节标题,我感觉这一节最重要的是对策略的形式的理解,还有重复剔除的分析。)
首先当然是大名鼎鼎的“囚徒困境”,不用讲了吧,关键是用这个例子来学习不同的表达形式。
先来看看严格占优策略:
如果对于参与人i的竞争对手可能选择的任何策略,
存在一个策略,“惟一一个使参与人i的支付最大化策略”,
我们就把这个策略称为参与人i的严格占优策略。
当然这个严格占优策略很好理解,但是现实中很少有这样的情况,
所以我们引入“劣策略”和“弱劣策略”。
这一段公式太多,大家自己去看书,我只是用土话说说我的理解:
对于所有其他参与者可能的选择,
只要有比该策略所有的支付都强的策略存在,就可以说这个策略是劣策略;
只要有不比该策略所有的支付都弱的策略存在,就可以说这个策略是弱劣策略。
下面这段话大家应该思考:
与严格劣策略不同,只根据理性原理是不能排除一个弱劣策略的。对于参与人i可以选择的任意备选策略,至少存在其他竞争对手的一个策略组合,使得弱劣策略仍成立。
一般来说,如果参与人总是相信,至少有某个正的概率,使得其竞争对手的任意策略都可能被选择,那么,弱劣策略就能被排除。我们在这里不再继续探讨这一思想,不过在8.F节中,我们会回过头来讨论它。现在,我们仍允许参与人对竞争对手如何行为作出任意推测,即使后者的行为是完全确定的。
[此贴子已经被作者于2008-12-12 16:25:37编辑过]
下面进入:重复剔除严格劣策略
剔除严格劣策略通常不会对博弈作出一个惟一预测。但剔除严格劣策略的逻辑可以被推向深人。
然后把囚徒困境推进了一步:DA的兄弟之困境。
我们给出了一个囚徒困境博弈的变形,称它为DA的兄弟博弈。
囚犯1,是DA的兄弟。在选择公诉对象间题上,DA有一定的权力。
具体来说,如果两个囚犯都不坦白,他可以对囚犯1作出无罪释放的判决。根据这个变动,如果囚犯2坦白,囚犯1也应坦白;但在囚犯2“不坦白”时,“不坦白”成了囚犯1的最优策略。因此,我们不能把囚犯1的任何一个策略作为劣策略排除,剔除严格劣(或弱劣)策略不会给出一个惟一的推断结果。
| 囚徒1是 | 囚徒2 | 囚徒2 | |
| DA的兄弟 | 坦白 | 不坦白 | |
| 囚徒1 | 坦白 | -5, -5 | -10, -1 |
| 囚徒1 | 不坦白 | -1, -10 | 0, -2 |
但是,如果我们把剔除严格劣策略的逻辑推向深入,仍然可以导出这个博弈的惟一的推断结果。注意,“不坦白”仍是参与入2的严格劣策略。而且,一旦囚犯1排除了囚犯2选择“不坦白”这种可能,那么毫无疑问,“坦白”是囚犯1的最优行动;也就是说,当囚犯2的严格劣策略被剔除后,“坦白”便是囚犯1的严格占优策略。因此,在DA的兄弟这个博弈中,惟一的推断结果仍应是(坦白,坦白)。
这个貌似简单的例子给我们什么启示呢?
参与人关于彼此支付和理性的共同知识是求解普通囚徒困境博弈的途径。剔除严格劣策略只要求每一个参与人是理性的。但我们刚才所做的,不仅要求囚犯2是理性的,而且要求囚犯1知道囚犯2是理性的。
稍微换个角度说,当参与人经过考虑把一个严格劣策略从其策略选择中剔除时,他无须了解任何有关竞争对手支付的情况,也不必确信其竞争对手的理性;但当参与人考虑剔除一个由于他的竞争对手们永远不会选择他们的劣策略,从而变成劣策略的策略时,他必须具备上面的知识。
秉承MWG的一贯“严密”作风,它开始了令我心惊肉跳的分析和拓展(only you........):
作为一个一般性问题,如果我们愿意假设所有参与人是理性的,并且假设这个事实以及参与人的支付是共同知识(因此,每个人知道每个人知道……每个人是理性的),那么,我们就不必在两轮重复剔除后停下来。我们不仅能剔除严格劣策略和第一轮策略剔除后出现的严格劣策略,而且还能剔除下一轮策略剔除后出现的严格劣策略,如此等等。
注意,每一轮的策略剔除有可能又会使其他策略成为严格劣策略,原因是参与人的竞争对手们所能选择的策略愈少,他的一个特定策略变成一个劣策略的可能性就愈大。但策略剔除每增加一轮,就要求参与人关于彼此理性的知识更深人一层。参与人现在不仅必须知道竞争对手是理性的,而且还必须知道他们知道他是理性的,而且还必须让他们知道他知道他们知道他是理性的,而且还必须让他们知道他知道他们知道他知道他们知道他是理性的.....................(后面两句是我加的,呵呵),如此等等。
其实这些还是好理解的,那么下面的“次序”问题,就让我有点头疼了。
[此贴子已经被作者于2008-12-12 16:42:15编辑过]
重复剔除严格劣策略过程的一个特点是,剔除次序不会对最后剩下的策略所构成的集合产生影响。
也就是说,如果在给定的任意一点,(一个或几个参与人的)几个策略是严格劣策略,那么,无论我们把它们一次剔除,还是以任意次序剔除,都不会改变最后剩下的策略所构成的集合。这很幸运,原因在于如果我们的推断要依剔除次序而定,我们会对此感到不安。
另一方面,弱劣策略就没这么“幸运”了。
我们很难证明重复剔除弱劣策略是合理的。如同我们已经指出的那样,参与人i剔除弱劣策略的理由是,他看到竞争对手的每一个策略组合被选择的概率都是正的。但这个假说与重复剔除的逻辑相抵触,后者明确假设,我们不能预期参与人选择被剔除的策略。这种不一致导致重复剔除弱劣策略不能令人满意,它可能依赖于剔除次序。
但问题是怎么证明前者呢?(后者可以随便举个例子就好了。)
[此贴子已经被作者于2008-12-12 16:45:23编辑过]
忽然发现,忘记了一件顶顶重要的事情:把搜集的链接贴上来!!!
请问占优均衡与颤抖的手均衡之间的区别
https://bbs.pinggu.org/b52i233431.html
请问博弈论的理论对于一个赌徒有用吗?
https://bbs.pinggu.org/thread-288426-1-1.html
什么样的问题适合用博弈论分析!
https://bbs.pinggu.org/thread-16966-1-1.html
我们为什么要学习博弈论?
https://bbs.pinggu.org/thread-55192-1-1.html
什么是博弈论啊?
https://bbs.pinggu.org/thread-15940-1-1.html
纳什均衡与占优策略均衡
https://bbs.pinggu.org/thread-75536-1-1.html
请教占优均衡和纯策略纳什均衡之间的区别
http://www.pinggu.org/BBS/b52i274477p9.html
----知道的请一定回答我---占优均衡和纳什的本质区别是什么
http://tel.pinggu.org/bbs/b47i139642.html
已经说过的内容,大致看这些就好了,剩下的慢慢加。
[此贴子已经被作者于2008-12-12 17:03:05编辑过]
下面,让我们开始“混合策略”!!
当我们认识到参与人可能在其纯策略上随机选择时,严格劣和严格占优策略这些基本定义就能够以一种直接的方式被一般化。
当随机选择可行时,为了检验纯策略是否是一个劣策略,只要检查对于参与者i的竟争对手的每一个可能的纯策略组合,参与者任意的混合策略是否都优于其他。
实际上,这一附加条件可以帮助我们剔除更多的纯策略,其原因在于,一个纯策略可能只劣于其他纯策略的一个随机组合;这就是说,为了决定一个策略是否优于另外一个策略,那么,即使是一个纯策略,我们可能也需要考虑包括随机选择的备选策略。
一旦我们确定了参与人的非劣纯策略集合,我们就要考虑哪些混合策略是非劣的。我们可以立即剔除任意使用了劣纯策略的混合策略;如果纯策略是参与人i的严格劣策略,那么,每一个把某个正概率指定给这个策略的混合策略也是参与人i的严格劣策略。
换(土话)言之,
1、混合策略才是“一般情况”,纯策略是特殊情况;
2、参与混合策略的纯策略里面有劣策略,那么这个混合策略肯定是劣的;
3、一个纯策略可能不劣于任何纯策略,但是它完全可能劣于这些纯策略的混合策略;
4、一个在非劣纯策略上随机选择的混合策略,同样可能就是劣策略。
(肯定还有类似的土话,我暂时想不到了,一会再说。。。)
[此贴子已经被作者于2008-12-12 17:46:37编辑过]
8 .C 可理性化策略(这一节的最重要就是搞清楚,什么是理性化?)
我们剔除了严格劣策略,原因在于无论理性参与人预计他的竞争对手将会选择什么策略,他也不会选择这样的策略。然后,我们应用参与人关于彼此理性和博弈结构的共同知识,证明了重复剔除严格劣策略的正确性。
但一般来讲,参与人关于彼此理性和博弈结构的共同知识能使我们剔除的重复严格劣策略还不止这些。这里,我们发展这种观点,导出可理性化策略的概念。理性化策略的集合恰恰是由那些在博弈结构和参与人的理性是共同知识的博弈中可能被选择的策略构成的。
注意,严格劣策略决不会是一个最优反应。但一般来说,即使一个策略不是严格劣策略,它也可能决不是一个最优反应。因此,剔除决不是一个最优反应的策略,它至少会与根据剔除严格劣策略的办法所剔除的策略一样多,也许还会更多一些。
而且如同剔除严格劣策略情形一样,理性和博弈结构的共同知识意味着,我们可以重复剔除那些决不是一个最优反应的策略。具体来说,一旦一个理性参与人剔除了这样的可能性,即他的任意竞争对手的选择决不可能是一个最优反应的策略,他就不应该选择一个决不是一个最优反应的策略,等等。
同样重要的是,重复剔除后剩下的策略是理性参与人根据某个关于竞争对手选择的合理猜想,可以证明为合理的策略,或者,可理性化的策略;所谓合理猜想也就是假设任意参与人都不会选择决不是一个最优反应的策略,或者对于其他参与人不会选择决不是一个最优反应策略的猜想,才是一个最优反应的策略,等等。结果,通过重复剔除过程的策略集合可以说恰恰就是在一个参与人的理性和博弈结构是共同知识的博弈中,理性参与人所选择的策略集合。它们被称为可理性化的策略。
这一节的例子太“宏大”了,没法子写上或者上传,但是请一定自己看一遍,否则干看这些,恐怕不好理解。
可理性化策略集合不会比重复剔除严格劣策略后剩下的集合更大。但可以证明,对于两人博弈(f = 2)的情形而言,这两个集合是相等的,原因是,在两人博弈中,当(混合)策略不是严格劣策略时,它就是对竞争对手某个策略选择的最优反应。
但是参与人数目大于2时,就可能存在虽然不是严格劣,但却不是一个最优反应的策略。其理由可能在参与人的随机选择是独立的这个事实中找到。如果参与人i的竞争对手的随机选择是相关的,等价关系就会重视(?翻译错误)。
[此贴子已经被作者于2008-12-12 19:25:18编辑过]
8.D 纳什均衡开始啦!!!
在一个纳什均衡中,每一个参与人的策略选择是对他的竞争对手实际选择的策略的一个最优反应。作了重点记号的字把纳什均衡概念与8.C节研究过的可理性化概念区别开来。
可理性化体现了参与人关于彼此理性和博弈结构的共同知识的蕴涵,只要求参与人的策略是对某个关于竞争对手将如何选择的合理猜想的一个最优反应,这里,“合理”一词的意义是,我们同样可以证明参与人所猜想的竞争对手的选择也是合理的。纳什均衡对此还要求,参与人在作猜想时就是正确的。
纳什均衡概念与可理性化策略概念之间的一般关系:每一个构成纳什均衡组合一部分的策略都是可理性化的,因为每一个参与人的纳什均衡策略的合理性都可以为其他参与人的纳什均衡策略所证明。因此,一般来说,纳什均衡概念所作的推断至少与可理性化概念所作的推断一样鲜明。实际上,纳什均衡概念常常给出更为鲜明的推断。(说实话,到这里还没看懂)
如果把严格占优策略、可理性化、纳什均衡的数学表达式摆在一起,也许会好些?

可否举个例子:一个不劣于任何纯策略的纯策略,却劣于某个混合策略。
可否举个例子:一个不劣于任何纯策略的纯策略,却劣于某个混合策略。
For example, 1 chooses {U,M,D}, 2 chooses {L,R}. Number denote the payoffs to 1
L R
U 3 0
M 1 1
D 0 3
Pure strategy M does not dominate any of the U,D, and it is not dominated by pure strategy U,D either
But mixed strategy 0.5U+0.5M dominates strictly M because no matter what player 2 plays, expected payoff is 1.5 to player 1
可否举个例子:一个不劣于任何纯策略的纯策略,却劣于某个混合策略。
或许是我没说清楚,才引起您的疑问:
应该说清,一个纯策略可能不“严格”劣于任何纯策略,
但是它完全可能“严格”劣于这些纯策略的混合策略。

在MWG对博弈论惜字如金(基本上全是公式)的分析中,有这么将近三整页的“细细道来”。
因此最好让我们也细细分析一下:纳什均衡概念的讨论
(感觉这部分中文版翻译的不是太好,我按照自己的翻译和理解摘录和改写的,
如果大家认为不对,欢迎提出。)
纳什均衡要求,预计参与人关于彼此选择的猜想是正确的,为什么呢?
或者更进一步地说,我们为什么要关心纳什均衡概念?
人们对纳什均衡概念提出了许多论证,一个论证在一项应用中也许是有说服力的,但在另外一项应用中却不能令人信服。到目前为止,所有的论证都是非正式的,我们的讨论也是一样。这个问题是人们已将纳什均衡概念广泛地用于应用性问题的情况下提出的,因此,它正在受到一些更规范的关注。
原因之一:纳什均衡是理性推断的结果。
人们有时认为,由于每个参与人都可以对他的竞争对手所面临的策略性考虑进行思考,因此理性自身意味着参与人一定能够正确地预见竞争对手的选择。虽然这个论点似乎很有吸引力,但它却是错误的。参与人关于理性(和博弈结构)的共同知识的含义,仅仅是每一个参与人一定会选择一个可理性化策略。理性未必导致参与人的预见是正确的。
原因之二:如果一个博弈存在一个惟一的结果,则纳什均衡就是它的必要条件。
这个原因的更好的描述是,如果博弈存在一个惟一的推断结果,那么理性参与人将会知道它是这个结果。因此,由于没有参与人想偏离这个推断结果,它一定是一个纳什均衡。还可以换种说法,如果参与人思考并分享博弈有一个明显(特别是惟一的)行为的信念,那么,这个信念一定是纳什均衡。
要注意,只有对参与人在博弈中如何行动所作的推断惟一时,这种论点才是贴切的。但对可理性化的讨论表明,理性的共同知识本身并没有蕴含上述论点。因此,只有再结合考虑这样一个问题即一个特定的策略组合为什么是一个特定博弈的明显的行为方式时,这种论证才是真正有用的。我们所讨论的纳什均衡的其他论证可以视为给这个论证加上了博弈有一个“明显”行为的理由。
原因之三:聚点(Focal Point)。
这个原因和谢林的聚点概念有关。我们取在纽约博弈为例,并假定中心车站地区的餐馆比帝国大厦周围的餐馆好得多,相会在中心车站的支付是(1000,1000)而不再是(100,100)。这时选择中心车站相会似乎是参与人明显要做的事情。
(我对此不太清楚的是,当支付改变了之后,纳什均衡就只剩下(1000,1000)这一个了吗?但根据定义,另一个不同样也还是另一个聚点吗?
)
聚点结果也可以是由文化所决定的。就像谢林在他的研究中所指出的那样,两个没有在纽约生活过的人可能发现相会在帝国大厦顶层(那是一个著名的旅游点)是个聚点;反之,两个纽约人会发现中心车站是一个更合适的选择。在这两个例子当中,都有一个结果具有自然的吸引力。回忆一下,上面说过的原因二的也说明了,只有这个结果是一个纳什均衡时,这种吸引力才能使它成为一个明显的推断。(只是个必要条件啊?)
[此贴子已经被作者于2008-12-13 14:49:08编辑过]
Nash均衡可以理解为一个“不动点”。
参与人间的互动达到了这样一种状态:对于任何一个参与人而言,只要其他任何参与人都没有改变当前的策略,该参与人也不会改变当前的策略。
没有人愿意单方面改变自己当前的策略,这就是Nash均衡的视角。
先继续写完,然后再讨论。
原因之四:纳什均衡是一个能自我执行的协议。
纳什均衡假设,参与人在博弈之前,能够参与无约束力的交流(个人认为,信息的,而非约束的)。如果参与人同意选择一个结果,那么它自然会成为明显的备选项。但由于参与人并不能使他们自己受他们所同意的策略的约束,所以,只有他们达成的任意协议是自我执行的,才会有意义。
因此,任意有意义的协议必然包括一个纳什均衡策略组合的选择。当然,即使参与人已达成协议选择一个纳什均衡,他们也可能偏离它,如果他们预计其他人也会这样做。实质上,这种论证假设,一且参一与人同意一个策略选择,他们达成的协议就会成为聚点。
原因之五:纳什均衡能够成为稳定的社会传统。
如果博弈重复进行,而且出现某种稳定的社会传统,那么,博弈的一种特定方式或许会随着时间的推移而产生。如果事实如此,那么,对所有参与人而言传统将被维持可能是“不言自明的”。由此可以说,传统便成为聚点。
一个很好的例子是纽约人每天所做的博弈:在曼哈顿市区步行。每天,步行上班的人都需要决定走人行道的哪一侧。随着时间的推移形成的稳定社会传统是每个人都走人行道的右侧,这个传统是由于以下事实的存在而得到执行的,任意单方而偏离传统的人肯定会受到严重蔑视。当然,在任意给定的一天,一个人有可能决定走人行道的左侧,因为他猜想其他每一个人都突然预料到传统的改变。但不管怎么说,在这种况下,关于我们仍将保持的“每个人都走人行道右侧”的纳什均衡的推断似乎仍是合理的。
注意,如果一个结果成为一个稳定的社会传统,它就一定是一个纳什均衡。如果它不是一个纳什均衡,那么它一出现,人们就会偏离它。
(我自己想起一个帖子:在某些场地,打篮球的时候,如果你给别人传球,估计别人不会给你传球的,因为你的选择不是纳什均衡,别人会一次次的偏离它,直到你自己也偏离。
见:体育的经济学视角分析之二:篮球的单打博弈 ttp://www.pinggu.org/bbs/b29i332659.html)
均衡概念作为某个动态调整过程的静止点(参见楼上sungmoo的说明),为均衡概念在经济学中的应用及其在经济学中所具有的魅力打下了基础。在这个意义上,纳什均衡的稳定社会传统论证最接近经济理论的传统。
[此贴子已经被作者于2008-12-13 15:10:36编辑过]
Nash均衡可以理解为一个“不动点”。
参与人间的互动达到了这样一种状态:对于任何一个参与人而言,只要其他任何参与人都没有改变当前的策略,该参与人也不会改变当前的策略。
没有人愿意单方面改变自己当前的策略,这就是Nash均衡的视角。
i would tend to say we care about Nash Equilibrium because we want to make prediction about strategic situations
I think this is interesting: "Nash equilibrium and the history of economic theory", Journal of Economic Literature 37 (Sept. 1999), 1067-1082.
i would tend to say we care about Nash Equilibrium because we want to make prediction about strategic situations
I think this is interesting: "Nash equilibrium and the history of economic theory", Journal of Economic Literature 37 (Sept. 1999), 1067-1082.
您说的不错。
不过我也有个想法,也许这是因为,经济学从此开始了向科学过渡的关键一步?
您说的这本杂志能从学术网站上找到吗?

个人以为,就make prediction而言,NE还是太过一般了,特别是,一个博弈会有太多NEs。
关键的一步还是在于,能否可重复验证。
最好别译作“静止点”,也最好别采用“动态调整过程”。这些字眼可能产生较多歧义。
最好别译作“静止点”,也最好别采用“动态调整过程”。这些字眼可能产生较多歧义。
书上的原文是:
The notion of an equilibrium as a rest point for some dynamic adjustment process underlies the use and the traditional appeal of equilibrium notions in economics.
我想这句话想表达的是:博弈参与者向某个共同满意的结果趋近(最终造成了更强的外部和传统文化的简单信号,而无需最初要求的“高度”理性),这就和传统的经济均衡的观点相一致了。
下面的一段小字的补充说的更加深入:
正式建立稳定社会传统出现的模型不是件简单的事。困难之一在于,重复的一天博弈(one-day game)本身可能被视作一个更大的动态博弈。因此,当我们考虑理性参与人在这样一个整体博弈中选择策略时,我们就又回到了原来那个问题:我们为什么应该预期在这个更大的博弈中有一个纳什均衡呢?
对于这一难点,一种目前的解释是,我们可以想象在参与人重复作博弈的情况下,关于竞争对手的可能选择,参与人是按简单的大拇指规则行事的(见下面的注释)。例如,一个参与人可以猜想,他的竞争对手在昨天做的什么都会在今天重复。如果是这样,那么参与人在每一天都会对昨天的选择作出一个最优反应。如果作为这个过程中的一个,静止点(即,今天的选择与昨天的选择相同)的一个策略组合出现时,那么,这个策略组合一定是一个纳什均衡。但我们仍不太清楚,从任意初始位置起,这一过程是否会收敛于一个静止结果:收敛性要依博弈而定。
拇指规则(rule of thumb):是一种在判断或决策时走捷径的经验法则,指人们在做出判断或决策时忽略一些相对不太重要的因素。由于被忽略的是非主要因素,依据拇指法则做出的决策仍然是近似理性的,也就是说,拇指法则仅导致了对于完全理性的微小偏离。
例如:
买鞋时不必挑来挑去,为买一双好鞋而跑的路,可能要磨坏几双鞋。
罪犯仓皇逃跑步时,往往更喜欢向右拐弯,如果在又路口不知道抢劫往哪儿跑了,最好向右追赶。
考六级时,不会做的题目选C。
大拇指法则的大拇指法则:踯躅不前时,不能再犹豫了。
[此贴子已经被作者于2008-12-13 17:19:24编辑过]
感觉上,混合策略纳什均衡和贝叶斯纳什均衡放在一起学习,
会有更好的效果。所以我们就一起来啦:
公式上,混合策略纳什均衡其实只是变化了符号的纯策略纳什均衡。
(至少我没看出两者的公式的区别。)
然后的整整一页的公式“群”,说明了这样几件事情:
1、随机选择带来混合策略均衡,但不一定带来纳什均衡。
2、参与人在他以正概率选择的策略之间的这种无差异乃是混合策略均衡的一般特征。
3、混合策略组合是纳什均衡的充要条件是:给定竞争对手所选择的策略的分布,每一个参与人在所有以正概率选择的纯策略之间是无差异的,并且这些纯策略至少与任意以零概率选择的纯策略一样好。(后面这半句是什么意思?)
只要没有一个参与人能从某个混合策略均衡变换到任意纯策略中使支付增加,这个混合策略均衡就是纳什均衡。
4、为了判别博弈的纯策略均衡,把注意力限于不允许随机选择的博弈就行了。(??)
然后,是下面的例子:相会在纽约博弈中的混合策略均衡。
让我们在相会在纽约博弈的变形中(这里在中心车站相会的支付是(1000,1000)),找出一个混合策略均衡。
如果托马斯先生要在帝国大厦与中心车站之间随机选择,他必然在这两者间是无差异的。假定谢林先生以概率a选择中心车站,那么托马斯先生选择中心车站得到的期望支付是1000×a+0×(1-a),选择帝国大厦得到的期望支付是100(1一a)+0×a。只有在a=1/11时,两个期望支付才相等。现在,如果谢林先生指定a = 1/11,他一定在两个纯策略之间无差异。由相同的论证我们可以发现,托马斯先生选择中心车站的概率也一定是1 /11。结论是,每个参与人以概率1 l11选择中心车站是一个纳什均衡。

虽然上面的东东完全搞懂很难,但是我想这个例子大家和我一样都看懂了吧?
[此贴子已经被作者于2008-12-13 19:13:54编辑过]
个人以为,就make prediction而言,NE还是太过一般了,特别是,一个博弈会有太多NEs。
於是有很多關於Equilibrium selections的研究, 我認為這是必要的事
Multiple equilibria 該源於一般Game model 比較General的結構, 當Model的結構做得比較仔細時, prediction應當不成問題
例如BNE在Auction theory就有不錯的應用, 也能驗証
参与人在他们以正概率选择的纯策略所指定的概率上,没有真实的偏好。那么,什么决定了每个参与人所用的概率?这应该从“均衡”来考虑:它使另外一个参与人在他的策略上是无差异的。
而这一事实使得一些经济学家和博弈理论家对混合策略纳什均衡作为博弈推断的有效性提出质疑。如果参与人总有一个纯策略,给他们带来的期望支付与均衡混合策略带来的期望支付相同,那么我们就不清楚参与人为什么要作随机选择。此外,参与人可能不会真的作随机选择。反之,他们可能会作出确定的选择,而后者又要受到只有他们才能观察到的、看似无意义的变量(“信号”)的影响。
例如,考虑一个大联盟棒球队的投手为使击球手捉摸不定而采取“混合投球”。他也许有一个完全决定的行动计划,但这个计划可能要依比赛当天他在床的哪一侧醒来,或者他在驾车赴赛场途中碰上的红灯数目而定。结果,即使投手的行为不是随机的,击球手也会把它视作随机的。
挺有意思的一段话,值得单独拿出来想想。
到目前为止,我们假设参与人的随机选择是独立的。例如,在相会在纽约博弈中,我们可以给出下面这样一个混合策略均衡:
自然为两个参与人提供了秘密而又是独立分布的信号,每一个参与人i都把决策与可能实现的不同信号对应起来。
但是,假定这里也有可得的公开信号,两个参与人都可观察到这个信号。这样,就会有许多新的可能性出现。每个参与人的策略选择仍是随机的,但现在,他们可以完全协调一致地行动,而且,他们总会相遇。更为重要的是,这种决策具有均衡特征——如果一个参与人决定按这个决策规则行事,那么,对另外一个参与人两言,这样做也是最优的。这是相关均衡的一个例子。更一般地,我们可以考虑自然信号部分秘密,部分公开这样的相关均衡。
考虑这样的相关性可能是很重要的,原因在于经济行为人可以观察到许多公开信号。正式地说,相关均衡是引入的贝叶斯纳什均衡的特殊情形。
[此贴子已经被作者于2008-12-13 19:41:25编辑过]
8.E 不完全信息博弈:贝叶斯纳什均衡
到目前为止,我们假设参与人知道彼此的所有相关信息,包括每一个参与人从不同的博弈结果得到的支付。这种博弈称为完全信息博弈。但是,思考一下,你就会相信这是一个非常强的假设。在许多情况下,参与人具有的是不完全信息。
不完全信息意味着什么呢:
1、共同知识还是一样存在的;
2、明白自己该怎么干,自己的信息很了解,也很理性;(前两条是我写的)
3、不完全信息意味着,我们需要考虑一个参与人关于其他参与人偏好的信念,他关于他们关于他的偏好的信念的信念,等等,这与可理性化的精神极其相似。
但幸运地是,处理这个问题,有一种得到广泛应用的方法,使得上述考虑是不必要的。这就是豪尔绍尼所创造的方法。在这种方法中,你想象每一个参与人的偏好是由一个随机变量的实现所决定的。虽然这个随机变量实际的实现只为参与人自己所观察,但它的事前概率分布却被假设为所有参与人之间的共同知识。
通过这种形式化,不完全信息的情况就被重新解释为一个不完美信息(还记得两者的区别吧?)博弈:自然首先行动,选择随机变量的实现,这决定了每一个参与人的偏好类型,而每一个参与人观察到的只是他自己的随机变量的实现。这种博弈称为贝叶斯博弈。
4、在本质上,我们可以把参与人i的每一个类型考虑为一个独立的参与人,他在竞争对手策略选择的条件概率分布给定的条件下,使自己的支付最大化。(在处理具体题目的时候,概率a决定了某个选择为占优策略)
[此贴子已经被作者于2008-12-14 10:45:46编辑过]
可能需要先区别博弈的类型,特别是,各类博弈(相关的信息结构)如何精确表述。
另外,博弈的类型与表述的类型,各是一个问题。
可能需要先区别博弈的类型,特别是,各类博弈(相关的信息结构)如何精确表述。
另外,博弈的类型与表述的类型,各是一个问题。
不太明白后面的这句,能否解释一下?
对于两者的关系,教材上给出了这样的解释:
上面,我们论证了混合策略可以解释为这样一种情况:参与人以看似无关的信号为条件,选择决定性策略(回忆棒球投手的例子)。我们现在可以对此再作些说明。
假定我们面对一个具有惟一混合策略均衡的完全信息博弈,其中参与人真的作出随机选择。现在,我们考虑为每一个参与人引入很多不同的类型(正式地,引人类型连续统)来改变这个博弈,并且不同参与人类型的实现是相互统计独立的。我们还假定,一个参与人的所有类型具有同一偏好。那么,这个贝叶斯博弈的(纯策略)贝叶斯纳什均衡恰恰与原来完全信息博弈中的混合策略纳什均衡等价。
而且,在许多情况下,你可以证明还存在“附近的”贝叶斯博弈,其中一个参与人不同类型的偏好只是稍有不同,贝叶斯纳什均衡趋于混合策略分布,并且每一种类型对于策略选择具有严格偏好。这些结论被称为提纯定理。(??)
我们也可以回头看看“相关均衡”问题。具体来说,如果我们允许上一段谈到的不同参与人类型的实现是统计相关的,那么,这个贝叶斯博弈的(纯策略)贝叶斯纳什均衡就是原来完全信息博弈中的一个相关均衡。博弈中所有相关均衡的集合是通过考虑所有可能的这一类贝叶斯博弈来判别的(即,我们考虑参与人观察到的所有可能信号)。

最后一段要和前面的“秘密信号”联系起来看,但是我还没看懂。
[此贴子已经被作者于2008-12-14 11:39:40编辑过]
感觉这里最好来一个例子,能够更好的区别两者:
还是纽约见面的例子吧:(我想用篮球传球和投篮的例子,不过感觉不好编,嘿嘿。)
| 中心车站 | 帝国大厦 | |
| 中心车站 | 1000, 1000 | 0,0 |
| 帝国大厦 | 0,0 | 100, 100 |
在混合纳什均衡中,双方都以1/11的概率选择中心车站,以10/11的概率选择帝国大厦。
| 自然1 | 中心车站 | 帝国大厦 |
| 中心车站 | 1000, 1000 | 0,0 |
| 帝国大厦 | 0,0 | 100, 100 |
| 自然2 | 中心车站 | 帝国大厦 |
| 中心车站 | 100, 100 | 0,0 |
| 帝国大厦 | 0,0 | 100, 100 |
在贝叶斯纳什均衡中,任何一方都视对方的概率而定:对方是自然1的概率大于1/11时,选择中心车站是占优的。
(写的有点问题,大家明白这个意思就好啦,呵呵)
[此贴子已经被作者于2008-12-14 11:36:01编辑过]
终于结束啦!!!
当我仔细看了三遍“颤抖手精炼”这部分之后,我承认我不可能在不了解足够数学基础的前提下,
直接看懂这些东西,而且很奇怪的是,本书中颤抖手精炼的位置和其他博弈论和高级微观教材中,
区别很大,其他教材都是将其放在后半部分,完美贝叶斯均衡和机制设计附近。
不知为何?
总之吧,我既然没读懂,就不能粘上几段似通非通的话来欺骗各位。
所以,如果没有更高水平的朋友来支持,这一章就先到此为止啦。
不过我绝对会再回来,把这部分完成,请相信!!

[此贴子已经被作者于2008-12-14 15:59:44编辑过]
博弈(按照信息结构不同)有多种类型,每种类型的博弈可以采用不同类型的表达式。
还有,我看了一下第九章“动态博弈”。
一是感觉图太多,二来好像无论考博考研,都用不到如此严整、简练而深刻的分析,因此也先空下。
直接进入第三部分“市场均衡和市场失灵”。
以后一定补上,呵呵。

扫码加好友,拉您进群




收藏
