全部版块 我的主页
论坛 经济学论坛 三区 微观经济学
15473 44
2008-12-11
第八章,同时行动博弈。
通读了一遍之后,感觉上比上面的博弈论基础难懂了不少。
不单单是指内容,而主要是因为安排上,
由于篇幅限制(比较少)和行文规范(非常严格),
教材对内容没有做反复的举例说明和详尽的展开。
所以这一章的内容不容易搞明白的地方肯定会更多,因此也许会拉来别的教程上的一些说明。
希望不会更混乱吧。
内容简介:
博弈论的核心问题——在一个由理性参与人(参与人完全了解博弈的结构和彼此的理性)参加的博弈中,我们应该预期观察到什么结果?
我们研究同时行动博弈,其中所有参与人同时行动,并且只行动一次。
在8.B节,引人占优策略与劣策略的概念。这些概念及其在重复占优概念中的扩展,对于理性参与人所应该选择的策略给出了第一个强制性限制。
在8.C节,通过定义可理性化策略的概念,把上述思想加以扩展。我们论证,参与人关于彼此理性和博弈结构的共同知识,恰好蕴含着参与人将选择可理性化策略。
8.D节引人重要的且得到广泛应用的纳什均衡概念,这是我们研究以均衡为基础的解的概念的起点。这个概念为参与人理性的共同知识的假设增加了一个条件即共同正确期望条件。通常,这会使得一个博弈的预测结果集合大为缩小。我们会比较详尽地讨论这个条件的合理性,以及纳什均衡的存在性条件。
在8.E节和8.F节,我们考察纳什均衡概念的两个扩展:贝叶斯纳什均衡和颤抖手精炼纳什均衡。
在8.E节,我们放宽纳什均衡的概念,以把具有不完全信息的情况考虑进来,在这种情况下,每个参与人的支付在某种程度上只为自己所知。这便产生了贝叶斯纳什均衡的概念。
在8.F节,我们探讨,如果参与人认为,她们的竞争对手在选择策略时可能以某个小的正概率犯错误,情况会怎样呢?我们定义(标准式)颤抖手精炼纳什均衡的概念,它是纳什均衡概念的一个扩展。

加油啦!!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2008-12-11 11:01:00

8.B占优策略和劣策略

(不知道为何起这个节标题,我感觉这一节最重要的是对策略的形式的理解,还有重复剔除的分析。)

首先当然是大名鼎鼎的“囚徒困境”,不用讲了吧,关键是用这个例子来学习不同的表达形式。

先来看看严格占优策略:

如果对于参与人i的竞争对手可能选择的任何策略

存在一个策略,“惟一一个使参与人i的支付最大化策略”,

我们就把这个策略称为参与人i的严格占优策略。

当然这个严格占优策略很好理解,但是现实中很少有这样的情况,

所以我们引入“劣策略”和“弱劣策略”。

这一段公式太多,大家自己去看书,我只是用土话说说我的理解:

对于所有其他参与者可能的选择,

只要有比该策略所有的支付都强的策略存在,就可以说这个策略是劣策略;

只要有不比该策略所有的支付都弱的策略存在,就可以说这个策略是弱劣策略。

下面这段话大家应该思考:

与严格劣策略不同,只根据理性原理是不能排除一个弱劣策略的。对于参与人i可以选择的任意备选策略,至少存在其他竞争对手的一个策略组合,使得弱劣策略仍成立。

一般来说,如果参与人总是相信,至少有某个正的概率,使得其竞争对手的任意策略都可能被选择,那么,弱劣策略就能被排除。我们在这里不再继续探讨这一思想,不过在8.F节中,我们会回过头来讨论它。现在,我们仍允许参与人对竞争对手如何行为作出任意推测,即使后者的行为是完全确定的。

[此贴子已经被作者于2008-12-12 16:25:37编辑过]

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-11 11:02:00

下面进入:重复剔除严格劣策略

剔除严格劣策略通常不会对博弈作出一个惟一预测。但剔除严格劣策略的逻辑可以被推向深人。

然后把囚徒困境推进了一步:DA的兄弟之困境。

我们给出了一个囚徒困境博弈的变形,称它为DA的兄弟博弈。 

囚犯1,是DA的兄弟。在选择公诉对象间题上,DA有一定的权力。

具体来说,如果两个囚犯都不坦白,他可以对囚犯1作出无罪释放的判决。根据这个变动,如果囚犯2坦白,囚犯1也应坦白;但在囚犯2“不坦白”时,“不坦白”成了囚犯1的最优策略。因此,我们不能把囚犯1的任何一个策略作为劣策略排除,剔除严格劣(或弱劣)策略不会给出一个惟一的推断结果。

   囚徒1是  囚徒2  囚徒2
  DA的兄弟  坦白 不坦白
  囚徒1 坦白 -5,                    -5 -10,                    -1
  囚徒1 不坦白 -1,                    -10 0,                        -2

但是,如果我们把剔除严格劣策略的逻辑推向深入,仍然可以导出这个博弈的惟一的推断结果。注意,“不坦白”仍是参与入2的严格劣策略。而且,一旦囚犯1排除了囚犯2选择“不坦白”这种可能,那么毫无疑问,“坦白”是囚犯1的最优行动;也就是说,当囚犯2的严格劣策略被剔除后,“坦白”便是囚犯1的严格占优策略。因此,在DA的兄弟这个博弈中,惟一的推断结果仍应是(坦白,坦白)。

这个貌似简单的例子给我们什么启示呢?

参与人关于彼此支付和理性的共同知识是求解普通囚徒困境博弈的途径。剔除严格劣策略只要求每一个参与人是理性的。但我们刚才所做的,不仅要求囚犯2是理性的,而且要求囚犯1知道囚犯2是理性的。

稍微换个角度说,当参与人经过考虑把一个严格劣策略从其策略选择中剔除时,他无须了解任何有关竞争对手支付的情况,也不必确信其竞争对手的理性;但当参与人考虑剔除一个由于他的竞争对手们永远不会选择他们的劣策略,从而变成劣策略的策略时,他必须具备上面的知识。

秉承MWG的一贯“严密”作风,它开始了令我心惊肉跳的分析和拓展(only you........):

作为一个一般性问题,如果我们愿意假设所有参与人是理性的,并且假设这个事实以及参与人的支付是共同知识(因此,每个人知道每个人知道……每个人是理性的),那么,我们就不必在两轮重复剔除后停下来。我们不仅能剔除严格劣策略和第一轮策略剔除后出现的严格劣策略,而且还能剔除下一轮策略剔除后出现的严格劣策略,如此等等。

注意,每一轮的策略剔除有可能又会使其他策略成为严格劣策略,原因是参与人的竞争对手们所能选择的策略愈少,他的一个特定策略变成一个劣策略的可能性就愈大。但策略剔除每增加一轮,就要求参与人关于彼此理性的知识更深人一层。参与人现在不仅必须知道竞争对手是理性的,而且还必须知道他们知道他是理性的,而且还必须让他们知道他知道他们知道他是理性的,而且还必须让他们知道他知道他们知道他知道他们知道他是理性的.....................(后面两句是我加的,呵呵),如此等等。

其实这些还是好理解的,那么下面的“次序”问题,就让我有点头疼了。

[此贴子已经被作者于2008-12-12 16:42:15编辑过]

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-11 11:07:00

重复剔除严格劣策略过程的一个特点是,剔除次序不会对最后剩下的策略所构成的集合产生影响。

也就是说,如果在给定的任意一点,(一个或几个参与人的)几个策略是严格劣策略,那么,无论我们把它们一次剔除,还是以任意次序剔除,都不会改变最后剩下的策略所构成的集合。这很幸运,原因在于如果我们的推断要依剔除次序而定,我们会对此感到不安。

另一方面,弱劣策略就没这么“幸运”了。

我们很难证明重复剔除弱劣策略是合理的。如同我们已经指出的那样,参与人i剔除弱劣策略的理由是,他看到竞争对手的每一个策略组合被选择的概率都是正的。但这个假说与重复剔除的逻辑相抵触,后者明确假设,我们不能预期参与人选择被剔除的策略。这种不一致导致重复剔除弱劣策略不能令人满意,它可能依赖于剔除次序。

但问题是怎么证明前者呢?(后者可以随便举个例子就好了。)

 

[此贴子已经被作者于2008-12-12 16:45:23编辑过]

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-11 11:24:00

忽然发现,忘记了一件顶顶重要的事情:把搜集的链接贴上来!!!

请问占优均衡与颤抖的手均衡之间的区别

https://bbs.pinggu.org/b52i233431.html

请问博弈论的理论对于一个赌徒有用吗?

https://bbs.pinggu.org/thread-288426-1-1.html

什么样的问题适合用博弈论分析!

https://bbs.pinggu.org/thread-16966-1-1.html

我们为什么要学习博弈论?

https://bbs.pinggu.org/thread-55192-1-1.html

什么是博弈论啊?

https://bbs.pinggu.org/thread-15940-1-1.html

纳什均衡与占优策略均衡

https://bbs.pinggu.org/thread-75536-1-1.html

请教占优均衡和纯策略纳什均衡之间的区别

http://www.pinggu.org/BBS/b52i274477p9.html

----知道的请一定回答我---占优均衡和纳什的本质区别是什么

http://tel.pinggu.org/bbs/b47i139642.html

已经说过的内容,大致看这些就好了,剩下的慢慢加。

[此贴子已经被作者于2008-12-12 17:03:05编辑过]

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-12 16:26:00

下面,让我们开始“混合策略”!!

当我们认识到参与人可能在其纯策略上随机选择时,严格劣和严格占优策略这些基本定义就能够以一种直接的方式被一般化。

当随机选择可行时,为了检验纯策略是否是一个劣策略,只要检查对于参与者i的竟争对手的每一个可能的纯策略组合,参与者任意的混合策略是否都优于其他。

实际上,这一附加条件可以帮助我们剔除更多的纯策略,其原因在于,一个纯策略可能只劣于其他纯策略的一个随机组合;这就是说,为了决定一个策略是否优于另外一个策略,那么,即使是一个纯策略,我们可能也需要考虑包括随机选择的备选策略。

一旦我们确定了参与人的非劣纯策略集合,我们就要考虑哪些混合策略是非劣的。我们可以立即剔除任意使用了劣纯策略的混合策略;如果纯策略是参与人i的严格劣策略,那么,每一个把某个正概率指定给这个策略的混合策略也是参与人i的严格劣策略。

换(土话)言之,

1、混合策略才是“一般情况”,纯策略是特殊情况;

2、参与混合策略的纯策略里面有劣策略,那么这个混合策略肯定是劣的;

3、一个纯策略可能不劣于任何纯策略,但是它完全可能劣于这些纯策略的混合策略;

4、一个在非劣纯策略上随机选择的混合策略,同样可能就是劣策略。

(肯定还有类似的土话,我暂时想不到了,一会再说。。。)

[此贴子已经被作者于2008-12-12 17:46:37编辑过]

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群