全部版块 我的主页
论坛 经济学论坛 三区 微观经济学
2008-12-10 12:59:00
以下是引用猫爪在2008-12-10 12:48:00的发言:那么此时,“策略”如何安排才能成为“相机行动”?

 退 扰 打 追
 进    
 驻    
 疲    
 退

敌有1个信息集(是单点集),该信息集上有4个行动;我有1个信息集(是多点集,有4个nods),该信息集上有4个行动。

这样,敌有4个策略,我有4个策略。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-10 13:01:00
以下是引用猫爪在2008-12-10 12:57:00的发言:这些“解释”需要哪些数学基础?

涉及的是“图论”。

不过,理解“树”就该足够了。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-10 13:02:00

OK!最后一段总结说明(中文版P326):

从前面的讨论中,我们已经知道对博弈的任意展开式表述,都存在惟一的标准式表述(更准确地说,对于任何重新命名或编号的策略,它都是惟一的)。但是,逆命题不成立。许多不同的展开式也许能由同一个标准式来表示。.......................从博弈盒的表示来看,这些博弈标准式之间的惟一差别在于行与列的“标记”不同。

由于标准式是对博弈的浓缩表述,一般来说,它略去了展开式中的一些细节。这种省略是否重要,或者标准式是否概括了所有策略相关的信息?我们也许会对此产生怀疑(文中正常字体印的内容的最后一段似乎也在暗示这一点)。

我们也可以用下述稍微不同的方式提出问题:参与人同时写下他们的策略并把它们提交给一位裁判的情况,真的与展开式所描述的参与人跨时作博弈的情况等价吗?目前,这个问题在博弈理论家之间尚有争议。争议的焦点集中在由动态博弈中所出现的问题上,我们将在第9章研究它们。

拿我们在第8章研究的所有参与人同时选择行动的同时行动博弈来说,标准式体现了所有策略相关信息。在同时行动博弈中,参与人的策略是简单的非相机行动选择。在这种情况下,参与人在标准式中的同时策略选择,与他们在展开式中的同时行动选择显然是等价的(这里通过不让参与人观察到彼此的选择来体现的)。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-10 13:08:00
以下是引用猫爪在2008-12-10 11:28:00的发言:
  退 扰 打 追
 进    
 驻    
 疲    
 退    

但这表明的是,双方同时博弈,而非顺序博弈。这种博弈中的“策略”,就不是“敌进我退,敌驻我扰,敌疲我打,敌退我追”了,而是“退、扰、打、追”四种。

需要注意的是,两种博弈的信息结构存在差异。而博弈论的语言就要刻画这种差异。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-10 13:12:00
扩展式与策略式可以表达同一信息结构,或者说,可以表达同一个博弈。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-10 13:33:00

"我”共四个信息集,每个信息集上都有两个行动,共有2^4=16个策略。

------------------------

如果我”有且只有四个信息集,而在每个信息集下对应四个行动:退,扰,打,追。这样我共有4^4=256个策略。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-10 13:39:00
以下是引用vincent_wgd在2008-12-10 13:33:00的发言:如果我”有且只有四个信息集,而在每个信息集下对应四个行动:退,扰,打,追。这样我共有4^4=256个策略。

是这样的。

***************

当然,这对应了另一个博弈。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-10 13:40:00
正是为了避免自然语言在表述博弈信息结构上的模糊性,人们采用了更严格的语言。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-10 13:53:00

刚才没注意,后面还有一节。

7.E 随机选择

到目前为止,我们假设参与人作出确定的选择。但我们没有先验的理由排除参与人作出随机选择的可能性。实际上,我们在第8章和第9章将会看到,在某些情况下,随机的可能性在博弈的分析中会起到重要作用。

....................(定义略)

当参与人在纯策略上作随机选择时,由此得到的结果本身也是随机的,它给出了博弈终点结上的一个概率分布。每一个参与人的标准式的支付函数ui(s)具有冯·诺伊曼一摩根斯坦效用函数的形式,

....................

注意,由于我们假设每个参与人独自作随机选择,因此,我们认为参与人随机选择的实现是相互独立的。

标准式表述的基本定义无需改动即可适用于参与人可以选择混合策略的可能性。我们只要考虑参与人的策略集得到扩张,从而既包括纯策略又包括混合策略的标准式博弈××××××(公式省略)就行了。

........................

注意,等价地,我们也可以设想一个参与人这样构造她自己的混合策略:参与人i可以接收到一个秘密信号氏,它在区间[0,1]上均匀分布,且独立于其他参与人的信号,参与人t根据该信号的随机实现来制定自己的行动方案,并以此构造她自己的混合策略。也就是说,她对每一个实现,规定一个纯策略。我们在第8章还要讨论混合策略的这种备择解释。

如果我们运用博弈的展开式表述,那么,参与人i还有另外一种随机选择的办法。她可能不是在S上的潜在的可能非常大的纯策略集上随机选择,而是分别在她的每一个信息集的可能行动中作出随机选择。这种随机的方法被称为行动策略。

对于完美回忆博弈(我们只研究这类博弈),这两类随机选择是等价的。这看上去可能很直观。对于参与人i的任意行为策略,都存在一个混合策略,使得对于她的竞争对手可能选择的任意混合策略或行为策略,它给出的结果上的分布与行为策略给出的分布恰好相同,反之亦然。

因此,我们究竟考虑哪种形式的随机选择,完全是个分析方便性问题:当分析博弈的展开式表述时,我们一般使用行为策略,而当我们分析博弈的标准式表述时,一般使用混合策略。

由于我们引人随机的方法完全是为了分析的方便,因此,在使用术语时我们将放松一些,把所有随机策略都称为混合策略。 

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-10 13:57:00
以下是引用猫爪在2008-12-10 13:53:00的发言:如果我们运用博弈的展开式表述,那么,参与人i还有另外一种随机选择的办法。她可能不是在S上的潜在的可能非常大的纯策略集上随机选择,而是分别在她的每一个信息集可能行动中作出随机选择。这种随机的方法被称为行动策略

通常译作“行为策略”?

纯策略、混合策略、行为策略,对应了不同的均衡。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-10 14:13:00
以下是引用sungmoo在2008-12-10 13:39:00的发言:
以下是引用vincent_wgd在2008-12-10 13:33:00的发言:如果“我”有且只有四个信息集,而在每个信息集下对应四个行动:退,扰,打,追。这样我共有4^4=256个策略。

是这样的。

***************

当然,这对应了另一个博弈。

我怎么感觉不大对呢?

这个和我们刚才谈的博弈,根本没有关系吧?

这样的策略举个例子,岂不是成了:

敌退我扰,敌疲我打,敌退我退,敌打我追,.................(一直下去,长达16个)。

一共256个策略,但其中只有一个是可行的。

[此贴子已经被作者于2008-12-10 14:56:54编辑过]

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-10 15:23:00
以下是引用猫爪在2008-12-10 14:13:00的发言:这样的策略举个例子,岂不是成了:敌退我扰,敌疲我打,敌退我退,敌打我追,.................(一直下去,长达16个)。一共256个策略,但其中只有一个是可行的。

vincent的意思是:敌共有1个信息集,该信息集上共有4个行动;我共有4个信息集,每个信息集上都共有4个行动。这样,敌共有4个纯策略,我共有256个纯策略。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-10 18:48:00
以下是引用猫爪在2008-12-9 11:17:00的发言:
以下是引用congbaobao在2008-12-9 11:09:00的发言:

看看雷东多的那本经济学与博弈论对全面学习Game Theory是很有好处的。

呵呵,好贵啊。

剑桥03书《经济学与博弈论》(Fernando Vega-Redondo )
https://bbs.pinggu.org/thread-254124-1-1.html

貌似是个封面的图片[em06]

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-10 18:52:00

老大写个笔记之类的吧~~~

要是再能介绍下博弈问题是如何定义为标准的规划或者最优控制问题,以及在宏观中的应用就好了

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-10 19:25:00
以下是引用qiuguihua2000在2008-12-10 18:48:00的发言:
以下是引用猫爪在2008-12-9 11:17:00的发言:
以下是引用congbaobao在2008-12-9 11:09:00的发言:

看看雷东多的那本经济学与博弈论对全面学习Game Theory是很有好处的。

呵呵,好贵啊。

剑桥03书《经济学与博弈论》(Fernando Vega-Redondo )
https://bbs.pinggu.org/thread-254124-1-1.html

貌似是个封面的图片[em06]

你当我是卖书的啊?

呵呵。

不过下面的链接是英文版,去买吧。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-10 19:30:00
以下是引用zhaojumping在2008-12-10 18:52:00的发言:

老大写个笔记之类的吧~~~

要是再能介绍下博弈问题是如何定义为标准的规划或者最优控制问题,以及在宏观中的应用就好了

您等等就好了,估计我的日程,两三年内就能研究到了,呵呵。

前者可以看看拉丰和梯若尔的书《政府采购与规制中的激励理论》。

后者很少有人研究,我只查到有篇论文“博弈论在宏观货币政策研究中的最新应用”。

再就是《协调博弈:互补性与宏观经济学》 罗素·W·库珀著 人大出版社。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-10 19:51:00
以下是引用sungmoo在2008-12-9 20:12:00的发言:
以下是引用猫爪在2008-12-9 10:48:00的发言:一个策略是一个完整的“相机方案”

“敌进我退,敌驻我扰,敌疲我打,敌退我追”是一个策略。

“人不犯我,我不犯人,人若犯我,我必犯人”是一个策略。

“兵来将挡,水来土淹”是否也是一个策略?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-11 09:48:00
以下是引用sungmoo在2008-12-10 13:57:00的发言:
以下是引用猫爪在2008-12-10 13:53:00的发言:如果我们运用博弈的展开式表述,那么,参与人i还有另外一种随机选择的办法。她可能不是在S上的潜在的可能非常大的纯策略集上随机选择,而是分别在她的每一个信息集可能行动中作出随机选择。这种随机的方法被称为行动策略

通常译作“行为策略”?

纯策略、混合策略、行为策略,对应了不同的均衡。

我没理解好这部分,也许是翻译的问题?

原文如下:

If we use the extensive form description of a game, there is another way that player i could randomize.

Rather than randomizing over the potentially very large set pure strategies in Si,

she could randomize separately over the possible actions at each of her information sets.

This way of randomizing is called a behavior strategy.

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-12 17:09:00
以下是引用dangyin在2008-12-10 19:51:00的发言:
以下是引用sungmoo在2008-12-9 20:12:00的发言:
以下是引用猫爪在2008-12-9 10:48:00的发言:一个策略是一个完整的“相机方案”

“敌进我退,敌驻我扰,敌疲我打,敌退我追”是一个策略。

“人不犯我,我不犯人,人若犯我,我必犯人”是一个策略。

“兵来将挡,水来土淹”是否也是一个策略?

我希望大家能提出类似的问题比较好,可惜没人理睬。

[em06][em06]
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-12 22:58:00
以下是引用dangyin在2008-12-10 19:51:00的发言:“兵来将挡,水来土淹”是否也是一个策略?

可以是——只要你设计好了这个博弈。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-12 23:07:00
以下是引用猫爪在2008-12-11 9:48:00的发言:我没理解好这部分,也许是翻译的问题?

翻译应该没有大问题。

混合策略是对各纯策略赋予一个概率(各纯策略的概率之和为1)。

行为策略是在各信息集上对该信息集上的每个行动赋予一个概率(在每个信息集上各行动的概率之和为1)。

设参与人有S1、S2两个信息集,S1上的可能行动有a1、a2、a3,S2上的可能行动有b1、b2、b3、b4。行为策略需要说明:参与人在S1上为a1、a2、a3各赋予了什么概率(这些概率之和为1),在S2上为b1、b2、b3、b4各赋予了什么概率(这些概率之和为1)。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-13 08:53:00
不能传上来分享吗
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-13 09:53:00
以下是引用sungmoo在2008-12-12 23:07:00的发言:
以下是引用猫爪在2008-12-11 9:48:00的发言:我没理解好这部分,也许是翻译的问题?

翻译应该没有大问题。

混合策略是对各纯策略赋予一个概率(各纯策略的概率之和为1)。

行为策略是在各信息集上对该信息集上的每个行动赋予一个概率(在每个信息集上各行动的概率之和为1)。

设参与人有S1、S2两个信息集,S1上的可能行动有a1、a2、a3,S2上的可能行动有b1、b2、b3、b4。行为策略需要说明:参与人在S1上为a1、a2、a3各赋予了什么概率(这些概率之和为1),在S2上为b1、b2、b3、b4各赋予了什么概率(这些概率之和为1)。

哦,原来如此。

一直想说这句话:学MWG的博弈论,比学内容更重要的是,一定要把它规范的形式和每一种表达学好!!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-13 10:55:00
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-13 14:33:00

 

我也来挤挤学习学习!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-13 20:31:00
3x
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-14 00:17:00
太好了,谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-15 11:48:00

很精彩!感谢分享!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-16 03:21:00
如果你能做后面的题,即使读不懂前面的文字问题也不大,否则就算读懂了也没多大用。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-16 09:24:00
以下是引用remlus在2008-12-16 3:21:00的发言:
如果你能做后面的题,即使读不懂前面的文字问题也不大,否则就算读懂了也没多大用。

你说的不错,我正在做,不过我不认为,前面的没看懂后面就能做对。

我是不会一个个把答案也输入的,也没必要,反正大家都有了。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群