版本二
基本定义是用概率向量来定义的:
MSE是,给定对方的混合策略,你的混合策略是最优的,这对每个人都成立。
这一定义等价于
MSE处,给定对方的混合策略,
1)你以正的概率选取的纯策略带来的期望收益应当相等
2) 你选择的混合策略期望收益应当大于或者等于你以零概率选择的纯策略带来的期望收益
这对每个人都成立。
先证明 必要性:前者推得后者
在你的MSE处,假如条件1不满足,则在这些纯策略中必定存在某一(或者一些)纯策略,能带来最高的期望收益,那么用以正的概率选取的期望收益较低的纯策略的概率选择这些纯策略,显然能给你带来更高的期望收益(因为你的混合策略的预期收益等于,你选择各个纯策略的预期收益乘以各自的概率)。这和你已经选择了最优的混合策略矛盾,所以条件1满足。
同理,在你的MSE处,假如条件2不满足,则在这些纯策略中必定存在某一(或者一些)纯策略,能带来更高的期望收益,那么用以正的概率选取的期望收益较低的纯策略的概率选择这些纯策略,显然能给你带来更高的期望收益(因为你的混合策略的预期收益等于,你选择各个纯策略的预期收益乘以各自的概率)。这和你已经选择了最优的混合策略矛盾,所以条件2满足。
再证明 充分性:后者推得前者
由条件1和2知道, MSE处,给定对方的最优混合策略,你选择的混合策略的期望收益应当大于或者等于选择你的策略集中所有纯策略带来的期望收益。
因为你的混合策略的期望收益等于,你选择各个纯策略的预期收益乘以各自的概率(混合策略的期望收益是你的策略集中的纯策略的凸组合)。所以,给定别人的混合策略,你所有可能的混合策略都小于或者等于选择纯策略能得到的最大期望收益。所以此时给定别人的混合策略,你选择的该混合策略的期望收益是所有可能的混合策略中最大的,命题得证。
[此贴子已经被作者于2005-3-29 22:13:46编辑过]