全部版块 我的主页
论坛 经济学人 二区 外文文献专区
2022-4-24 19:24:51
事实上,如果第一个玩家选择了一个选项*m={*0, *1.*(m)- 1) },那么第二个p层可以选择j* 从G(必须存在,因为m被定义为最小排除数),并继续获胜*j+*j作为第二名选手。如果第一个玩家从G中选择一个选项,比如*a、 我们正在鉴别两个病例。如果a>m,则第二个玩家减少*a到*我赢了。如果a<m,那么第二个玩家可以减少*我要*a和胜利。(请注意,根据mex的定义,a=m是不可忽略的。)34 2. 组合游戏Theorem 2.4(SPRAGUE-GRUNDY)。每个公平的组合对策G={A,B,C,…|A,B,C,…,T}等价于一个唯一的nim型对策*m、 数m被称为格伦迪数G(G),可以递归计算:(12)m=G(G)=mex{G(A),G(B),G(C),…,G(T)}。证据我们通过对| G |和注G的归纳来证明这个定理≡ O如果| G |=0。通过归纳,我们现在证明了这个定理对于G的所有选项,即A是正确的≡ *a、 B≡ *b等。a=G(a),b=G(b)等。因此我们可以讨论G≡ *m=*G(G)与引理2.1的证明完全相同。G不能等同于另一个nim gam e*k自(如下文第2.11条所示):*K≡ *m==> k=m。例2.11。显示所有自然数k和n:*K≡ *M<==> k=m.EX.2.12(青蛙的格兰迪数)。设F(n,k)为x的青蛙游戏。2.4和G(n,k)是它的格兰迪数。对于k=3,F(n,k)具有选项sF(n- 1,3),F(n)-2,3),F(n)- 3, 3).所以相关的格伦迪数G(n,3)具有递归G(n,3)=mex{G(n- 1,3),G(n)- 2,3),G(n)- 3)}.显然,G(0,3)=0,G(1,3)=1和G(2,3)=2。然后,递归产生后续的格兰迪数:N012345678910··G(n,3)01230123012··第二名玩家赢得nim游戏*m当且仅当m=0。因此,第一个玩家可以在GRUNDY numberG(G)6=0的情况下赢得公平的游戏G。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 19:24:58
总的来说,我们注意到:o不偏不倚比赛的获胜策略:采取行动G7→ G′到选项G′的格伦迪数G(G′)=0.6。我喜欢玩356.1部分游戏。格兰迪数之和。如果G和H是公平的对策,且它们的m=G(G)和n=G(H),则它们的GRUNDY数为G(G+H)=G(*n+*m) 的确,如果G≡ *m和H≡ *n、 然后G+H≡ *m+*n必须保持。为了研究求和,我们可以把自己局限于nim博弈。此外,基本性质G(G+G)=G(*n+*n) =G(O)=0建议在二元代数的背景下研究和。二元代数。回想一下,每个自然数n都有一个唯一的二进制表示,即2,n的幂=∞Xj=0αjj,二元系数αj∈ {0, 1}. 我们根据规则0定义0和1的二元加法⊕ 0 = 0 = 1 ⊕ 1和0⊕ 1 = 1 = 1 ⊕ 0并将其扩展到自然数:∞Xj=0αjj⊕∞Xj=0βjj=∞Xj=0(αj)⊕ βj)2j。备注2.5。注意,αj=0必须适用于所有j>logn ifn=∞Xj=0αjj和αj∈ {0, 1}.例2.13。自然数m,n,k:n的二进制加法⊕ m=m⊕ nn⊕ (m)⊕ k) =(n)⊕ m)⊕ 千牛⊕ M⊕ k=0<==> N⊕ m=k.回想定理2.2!36 2. 组合博弈和定理。我们认为NIM游戏有三堆N,M和K对象,即3个单一NIM游戏的总和。*N*m、 及*k、 引理2.2。对于所有自然数n,m,k,一有:(1)如果n⊕M⊕k6=0,则第一个玩家获胜*n+*m+*k、 (2)如果n⊕M⊕k=0,则第二名玩家获胜*n+*m+*k、 证据。我们在n+m+k上用归纳法证明了引理,并注意到(1)和(2)在n+m+k=0的情况下显然是正确的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 19:25:04
通过归纳,我们现在假设引理对所有自然的麻木词n′,m′,k′是真的,这样n′+m′+k′<n+m+k。我们现在必须证明引理对n,m,k具有二进制表示sn=∞Xj=0αjj,m=∞Xj=0βjj,k=∞Xj=0γjj。在(1)与n的情况下⊕ M⊕ k6=0,必须至少有一个j使得αj⊕βj⊕ γj=1。设J为此类指数J的最大值。其中两个系数αJ、βJ、γJ必须相等,第三个系数的值必须为1。假设αJ=βJandγJ=1,这意味着⊕ m<k和n+m+(n⊕ m) <n+m+k.设k′=n⊕m、 我们声称,第一个玩家可以通过减少*克托*k′。事实上,归纳假说认为引理对n,m,k′是正确的。辛森⊕ M⊕ k′=n⊕ M⊕N⊕ m=0,属性(2)gu Arantes是减少nim游戏中第二个玩家的获胜策略*n+*m+*k′。但后者最初是第一个玩家!因此,我们发现陈述(1)是正确的。在案例(2)中,当n⊕M⊕k=0时,第一名玩家必须在三堆中的一堆上移动。让我们这么说吧*n减少到*n′。因为n=m⊕k、 我们没有6=m⊕k,因此n′⊕M⊕k6=0。因为引理被假定为n′,m,k的真引理,所以陈述(1)保证了简化博弈中第一个玩家的获胜策略*n′+*M*k、 六,。我是第37个玩家,最初是第二个玩家。定理2.5(公平博弈之和)。对于任意部分组合对策G和H,一个hasG(G+H)=G(G)⊕ G(H)。证据设n=G(G),m=G(H),k=n⊕m、 然后n⊕m+k=0。所以引理2.2说第二个玩家赢了n*+ *M*(n)⊕m) ,哪个yieldsG+H≡ *n+*M≡ *(n)⊕ m) 。因此,n⊕ m必须是G+H的格兰迪数。我们将使用ni m gameG=*1 + *3.* + * 5 + *7个桩,分别带有1个、3个、5个和7个物体。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 19:25:10
桩尺寸的二进制表示为1=1·23=1·2+1·25=1·2+0·2+1·27=1·2+1·2+1·2。所以G的格兰迪数是G(*1 + *3.* + * 5 + *7) = 1 ⊕ 3.⊕ 5.⊕ 7 = 0.因此,在正常比赛中,第二名球员可以赢得G。例2。1 4. 支持第一个玩家从7英寸G=*1 + *3.*+ *5 + *7.第二个玩家应该如何回应?例2.15。有一堆10块红色的鹅卵石,还有一堆10块黑色的鹅卵石。两层交替移动,选项如下:o任意一层:取至少1块但不超过3块红色卵石或:取至少1块但不超过2块黑色卵石。哪些球员在正常比赛中有获胜策略?(提示:分别计算红堆和黑堆的格伦迪数(如例2.4所示),并应用定理2.5。)第三章零和博弈零和博弈是对组合博弈模型的抽象。它们是从数学优化问题中自然产生的拉格朗日对策,为博弈论和数学优化理论之间提供了重要的联系。特别是,博弈中的战略均衡对应于优化问题的最优解。相反,数学优化技术是分析博弈论情况的重要工具。与前一章一样,我们考虑了2个代理(或玩家)的游戏行为。然而,玩家不必从s cratch计算出明确的策略,而是假设他们已经拥有了可能的策略集X和Y(或决定,或行动等)。一个玩家现在选择了一个策略x∈ X和另一个玩家a策略y∈ Y因此,可以将Γ视为在sy杆=X×y={(X,y)|X上演奏∈ 十、 y∈ Y}∪{σ} 在所有可能的球员联合战略选择中,让她有一个初始状态σ。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 19:25:16
Γ是一个零和博弈,如果有函数u:X×Y→ R将战略选择的效用(x,y)编码为单个参与者的效用值加起来等于零:(1)u(x,y)=u(x,y)是x参与者的收益;(2) u(x,y)=-U(x,y)是y玩家的增益。所以这两名球员有相反的目标:(X)X球员想要选择X∈ X为最大化U(X,y)。(Y) Y玩家想要选择Y∈ 使U(x,Y)最小化。我们用Γ=Γ(X,Y,U)来表示相应的零和博弈。零和GA-MESEX。3.1. 一个组合博弈,其策略集分别为X和Y,原则上是一个具有效用函数U(X,Y)的零和博弈=+1如果x是x玩家的制胜策略-1如果y是x-player0的制胜策略,则为0。1.矩阵对策在有限策略集的情况下,比如X={1,…,m}和Y={1,…,n},函数U:X×Y→ R可以用矩阵形式给出:U=嗯。u1nuu。u2n。。。。。。。。。嗯。巫统∈ Rm×n.Γ=(X,Y,U)是一种游戏,其中X-玩家选择一行i,他们选择一列j。这种联合选择(i,j)h作为行玩家的可用性值uijh和(-uij)为专栏播放机。作为例子,考虑效用矩阵(13)U=+1.-2.-1 +2.没有明显的总体“最佳”策略选择。无论玩家选择的是哪一个i栏或j栏,其中一个玩家都会发现另一个选择会更有利。从这个意义上说,这个游戏没有“解决方案”。在进一步探讨这一点之前,我们将介绍一个关于两层之间平衡项的零和解的一般概念。2.均衡让我们假设零和博弈Γ=(X,Y,U)中的两个参与者都在规避风险,并希望在最坏的情况下以最佳方式确保自己。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 19:25:23
因此,考虑最坏情况函数离子(14)u(x)=min。∈余(x,y)∈ R∪ {-∞}U(y)=maxx∈徐(x,y)∈ R∪ {+∞}.因此,x-player在事后看来面临着首要问题!2.平衡41(15)maxx∈XU(x)=maxx∈Xminy∈YU(x,y),而y-player必须解决miny(16)的双重问题∈YU(y)=miny∈Ymaxx∈XU(x,y)。根据定义,可以立即推断出任何x∈ X安迪∈ 原始对偶不等式:(17)U(x)≤ U(x,y)≤ 我们在(x)处说th*, Y*) ∈ 如果满足等式U(X),则X×Y是博弈Γ的平衡点*) = U(y)*), i、 例如,如果一元对偶不等式实际上是一个等式:(18)maxx∈Xminy∈YU(x,y)=U(x*, Y*) = 米尼∈Ymaxx∈《平衡》中的徐(x,y)*, Y*), 没有一个规避风险的参与者有动机偏离所选择的策略。从这个意义上说,均衡代表了参与者的最优策略。例3.2。在矩阵U为(13)的矩阵博弈中,确定两个参与者的最佳最坏情况策略,并确保博弈不平衡。给fu rthermore举一个至少有一个平衡点的ma trix博弈的例子。如果策略集X和Y是有限的,因此Γ=(X,Y,U)是一个矩阵博弈,那么均衡是否存在的问题原则上可以通过一个简单的过程在有限时间内解决:o检查每个策略对(X*, Y*) ∈ X×Y表示属性(18)。如果X和Y是有限的,通常只有当函数U:X×Y时才能确定平衡的存在→ R具有特殊的性质。从理论角度来看,凸性的概念是非常有用和重要的。42 3. 零和GA MES3。凸零和对策称为点x,…,的凸组合,xk∈ Rn是系数为λi的线性组合x=kXi=1λixi≥ 0这样的t hatkXi=1λi=1。x的一个重要解释是基于系数向量λ=(λ。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 19:25:29
,λk)是一个概率分布:o如果从集合{x,…,xk}中以概率λi选择一个点xi,那么凸组合x的成分实际上是s到所选点的期望成分值。另一种观察X的方法是:如果在Li席席席上放置大小为L的权重,则X是重心。一组X 如果X包含所有可能的有限子集{X,…,xk}的所有凸组合,则Rn是凸的 X.EX.3.3。设S={S,…,sm}一个带m的ar比特集≥ 1.要素。证明了S上的所有概率分布λ的集合构成了Rm的一个比较凸子集。函数f:X→ R是凸的(或凸的u p),如果X是某个坐标空间R的凸子,并且对于每个X,xk∈ 概率分布λ=(λ,…,λk),一个hasf(λX+…+λkxk)≤ λf(x)+…+λkf(xk)。如果g=-f是凸的(向上)。用这个术语,我们说如果(1)X和Y是非空凸策略集,零和对策Γ=(X,Y,U)是凸的;(2) 利用率U:X×Y→ R是这样的(a)对于每个y∈ Y,地图X7→ U(x,y)是凹的。(b) 每x∈ 十、 地图y 7→ U(x,y)是凸的。更多详情参见附录第2节3。凸零和对策43一般凸零和对策的主要定理保证在紧策略集的情况下至少存在一个平衡点:定理3.1。一个凸零和对策Γ=(X,Y,U)具有紧策略集X和Y,且连续效用U允许策略均衡(X*, Y*) ∈ X×Y。证据由于x和y是凸的和紧的,所以z=x×y,因此也是z×z。考虑g:z×z上的连续函数。→ 其中g((x′,y′,(x,y))=U(x,y′)- U(x′,y)。因为U在第一个变量x和(-U) 凹在s经济变量y中,我们发现G在第二个变量(x,y)中是凹的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 19:25:36
因此,我们从附录中的推论A.1中得出一个元素(x)的存在性*, Y*) ∈ Z满足所有人(x,y)∈ Z不等式0=G((x)*, Y*), (十)*, Y*)) ≥ G((x)*, Y*), (x,y))=U(x,y*) - U(x)*, y) 和henceU(x,y*) ≤ U(x)*, y) 为了所有的x∈ X和所有y∈ Y这个是x*如果y玩家选择y,x玩家的最佳策略是什么*∈ Y同样地,y*对x是最优的*. 换句话说,(x*, Y*)是(X,Y,U)的平衡。定理3.1不仅在博弈论中,而且在一般的数学优化理论中都有重要的影响,我们将在下面的第4节中更详细地描述。为了说明这种情况,让我们首先看看rando在有限零和博弈中使战略决策最优化的特例。3.1. 简化了矩阵游戏。具有有限集X={1,…,m}的零和博弈eΓ=(X,Y,U)的效用U可以描述为amatrix U=[uij]∈ Rm×N,系数uij。这样的矩阵游戏并不一定承认公平。假设玩家随机选择各自的策略。也就是说,x-玩家决定x上的概率分布x,并选择一个i∈ X和概率XI。类似地,y-player在y上选择概率分布,并选择j∈ Y和p概率yj。然后x-player的预期增益isU(x,y)=mXi=1nXj=1ijxiyj。44 3. 零和GA MESSo我们得到一个零和博弈Γ=(X,Y,U),其中X是X上的概率分布集,X是概率分布集onY。X和Y是紧凸集(参见E X.3.3)。函数U在这两个分量中都是线性的,既凹又凸。因此,Γ是满足定理3假设的凸博弈。1因此允许一种平衡。这证明了冯·诺依曼的定理:定理3.2(冯·诺依曼)。让你∈ Rm×nbe系数为uij的任意矩阵。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 19:25:42
然后就有了x*∈ X和y*∈ 如此之大∈Xminy∈yxijijxiyi=Xijuijx*艾伊*i=米尼∈Ymaxx∈第二十一条戒酒西医。其中X是{1,…,m}上所有概率分布的集合,{1,…,n}上所有概率d分布的集合。3.2. 协同计算方面。虽然在零和博弈中计算平衡通常不容易,但对于随机矩阵博弈来说,这项任务变得容易处理。例如,考虑两组x= { 1,…,M}安迪={ 1,…,n}和效用矩阵Re=嗯。u1nuu。u2n。。。。。。。。。嗯。巫统∈ Rm×n概率分布x∈X和y∈ Y,X-player i sU(X,Y)=mXi=1nXj=1ijxiyj=nXj=1yj的预期效用mXi=1uijxi.因此,对于x-player来说,最坏的情况发生在y-player选择一个概率分布时,该概率分布将全权重1置于k上∈ Y使得mXi=1uikxi=min(mXi=1uikxi | j=1,…,n)=U(x)。因此(19)maxx∈XU(x)=maxz∈R、 x∈X{z|z≤mXi=1对于所有i=1,m} 。J.冯·诺依曼(1928):祖尔·德格塞尔沙夫斯皮尔,马萨诸塞州。安娜兰1004。拉格朗日对策45类似地,当x-玩家将全概率权重设为1时,y-玩家的最坏情况也会出现l ∈ X使得nxj=1uljyj=max(nXj=1uijj | i=1,…,m)=U(y)。这会产生肉末∈YU(y)=minw∈R、 y∈Y{w|w≥nXj=1uijjj对于所有j=1,n} 。该分析显示:位置3.1。如果(z)*, 十、*) 是(19)和(w)的最优解*, Y*) (20)的最优解,然后(1)(x)*, Y*) 是Γ=(X,Y,U)的平衡。(2) z*= 马克斯∈徐(x)=米尼∈YU(y)=w*.备注3.1。如下面第4.4节所述,优化问题(19)和(19)是所谓的线性规划,它们彼此是对偶的。在实践中可以非常有效地解决这些问题。对于显式求解算法,我们请感兴趣的读者参考有关数学优化的标准文献。4.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 19:25:49
拉格朗日对策零和对策的分析与数学优化中的一项基本技术密切相关。非优化问题的一种非常普遍的形式是ismaxx∈Ff(x),其中F可以是任何集合,F:F→ R是任意的目标函数。然而,在我们的上下文中,我们将研究更具体的问题,并通过数学优化问题来理解形式(21)maxx的问题∈Xf(x)使得g(x)≥ 0,其中X是某些坐标s的子集,具有目标函数f:X→ R.向量值函数g:X→ 这是一种限制。g、 ,U.FAIGLE,W.KERN和g.STILL,数学程序设计的算法原理,Springer(2002)46 3。零和GA-MESfunction并结合m实值限制函数gi:X→ 辅助组件。(21)isF={x的可行解集∈ X | gi(X)≥ 0表示所有i=1,m} 。备注3.2。模型(21)将问题作为最大化问题进行优化。当然,由于minx的存在,极小化问题也可以在这个模型中表述出来∈Ff(x)=-马克斯∈目标函数F(x)=-f(x)。优化问题(21)产生了一个零和博弈∧=(X,Rm+,L),其效用是所谓的拉格朗日函数(22)L(X,y)=f(X)+yTg(X)=f(X)+mXi=1yigi(X)。我们把to∧称为拉格朗日对策。例3.4(凸拉格朗日博弈)。如果X是凸的且目标函数f:X→ (21)中的R以及限制函数gi:X→ 罕见的凹,那么拉格朗日对策∧=(X,Rm+,L)是凸零和对策。实际上,对于每个y,L(x,y)在x中是凹的≥ 0,且每x以y为单位呈线性∈ 由于线性函数是凸的,所以对策∧是凸的。互补性松弛。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 19:25:55
元素x的选择∈ 至少有一个限制违反gi(X)<0的X将允许游戏∧=(X,Rm+,L)中的y玩家增加其与yi的效用值≈ ∞. 因此,规避风险的x-player总是会尝试选择一个可行的x。另一方面,如果gi(x)≥ 0代表所有i,y玩家能做的最简单的事情是选择y∈ Rm+使得所谓的补元松弛条件(23)mXi=1yigi(x)=yTg(x)=0,因此L(x,y)=f(x)这个想法可以追溯到J.-L.拉格朗日(1736-1813)4。拉格朗日对策47是令人满意的。因此,我们发现:原始拉格朗日问题与原始问题相同:(24)maxx∈Xminy≥0L(x,y)=maxx∈FL(x)=maxx∈Ff(x)。对偶拉格朗日最坏情况函数为(25)L(y)=maxx∈Xf(x)+yTg(x)。引理3.1。If(x)*, Y*) 是拉格朗日对策∧的平衡点,然后是x*是问题(21)的最优解。证据对于每个可行的x∈ F、 我们有(x)≤ L(y)*) = L(x)*) = f(x)*).所以x*这是最优的。4.1. KKT条件。引理3.1指出了在拉格朗日对策中识别平衡点的重要性。为了建立必要的条件,我。e、 ,平衡候选必须满足的条件,我们对问题(21)施加进一步的假设:(1)X 我认为这是一个凸集。e、 ,X包含w和每个X,X′也包括整个线段[X,X′]={X+λ(X′)-x) |0≤ λ ≤ 1 }.(2) 函数f和giin(21)具有连续的部分导数f(x)/xjandgi(x)/xj对于所有j=1,n、 因此,拉格朗日函数的所有偏导数。所以L向x变量方向d的边际变化是xL(x,y)d=f(x)d+mXi=1yigi(x)d=nXj=1f(x)xjdj+mXi=1nXj=1gi(x)xjyidj。48 3. 零和遗传算法3.3(雅可比矩阵)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 19:26:02
具有as系数Dg(x)ij的(m×n)矩阵Dg(x)=gi(x)函数g:Rn的偏导数→ Rmis被称为函数矩阵或雅可比矩阵。它允许拉格朗日函数的边际变化采用紧凑的矩阵表示法:xL(x,y)d=f(x)+yTDg(x)d.引理3.2(KKT条件)。这对(x,y)∈ X×Rm+不能成为LAGRANGE对策∧的平衡点,除非:(K)g(X)≥ 0,也就是说,xi是可行的。(K) yTg(x)=0。(K)xL(x,y)d≤ 0对ll d有效,因此x+d∈ X.证据。我们已经知道,可行性条件(K)和互补松弛条件(K)必然满足平衡。如果(K)被违反,并且xL(x,y)d>0为真,x-player可以通过将BIT i移动到方向d来改善L值。这与“平衡”的定义相矛盾。备注3.4。引理3.2的三个条件就是所谓的KKT条件。尽管它们总是必要的,但它们并不总是足以证明候选人(x,y)确实是一个平等的人。4.2. 影子价格。优化问题(26)maxx∈Rn+f(x)s.t.a(x)≤ B安(x)≤ 具有m个限制函数gi(x)=bi的(21)型BMI- ai(x)和拉格朗日函数c。G.雅各比(1804-1851),以数学硕士卡鲁什、库恩和塔克的名字命名。拉格朗日对策49L(x,y)=f(x)+mXi=1yi(bi)- ai(x))=f(x)-mXi=1yiai(x)+mXi=1yibi。对于问题(26)的直观解释,可以将a向量处的d=(x,…,xn)视为n个产品的生产计划,数量为x,f(x)为x的市场价值。假设x需要使用m种材料,数量分别为ai(x),对于i=1。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 19:26:09
,m,并且偏差是制造商同意的材料数量。如果Yi代表m种材料的市场价格(每单位),L(x,y)是生产x的市场价值加上生产x后留在库存的材料价值。制造商当然希望该值尽可能高。”“市场”是制造商的对手,并关注其价值-L(x,y)=mXi=1yi(ai(x)- bi)- f(x),即制造商为生产x而必须在市场上购买的材料的价值减去市场为生产x而必须向制造商支付的生产价值。市场希望将价格设置为-L(x,y)尽可能大。因此:o制造商和市场扮演着拉格朗日∧的角色等平衡平衡(x*, Y*) 其中∧反映了一种经济平衡:无论是制造商还是市场都无法通过改变生产计划或设定不同的价格来保证提高其价值。从这个意义上说,生产计划x*这是最优的。(从市场的角度)最优价格是y*, . . . , Y*制造所谓的材料影子价格。50 3. 零和GA MES互补松弛条件(K)表示一种材料在库存中,但x没有完全使用*市场价值为零:ai(x)*) < 毕==> Y*i=0。条件(K)意味着x是最优值f(x)的生产计划*) = L(x)*, Y*) 在给定的限制下。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 19:26:15
此外,一个hasmXi=1y*iai(x)*) =mXi=1y*ibi表示,用于生产x的材料的价格*等于影子价格y下的存货价值*i、 Property(K)表示,边际变化xL(x)*, Y*)在X的任何可行生产修正中,制造商价值的d为负值*到x*+ d且仅适用于市场,因为x(-L(x)*, Y*)) = -xL(x)*, Y*).我们将回到第1.3.4.3节合作博弈理论的内容中的生产g ames。凸拉格朗日对策的平衡。值得注意的是,KKT条件对于具有可微目标函数的凸拉格朗日对策中平衡点的刻画不仅是必要的,而且是充分的。这提供了一种计算此类平衡的方法,并在实践中解决了e(21)型优化问题:o找到一个解决方案(x*, Y*) ∈ KKT不等式的X×Rm+。(十)*, Y*) 将产生∧=(X,Rm+,L)和X中的平衡*将是(21)的最佳解决方案。定理3.3。一双(x)*, Y*) ∈ X×Rm+是凸拉格朗日对策∧=(X,Rm+,L)的平衡点当且仅当(X*, Y*)满足KKT条件。证据从引理3.2中,我们知道kkT条件是必要的。为了显示效率,假设(x*, Y*) ∈ X×Rm+满意利润不是我们当前的目的,我们不打算详细研究进一步的计算方面,这可以在有关数学编程的现有文献中找到。拉格朗日对策51KKT条件。我们必须证明(x*, Y*) 是拉格朗日博弈∧=(X,Rm+,L)的均衡,即满足(27)maxx∈XL(x,y)*) = L(x)*, Y*) = 米尼≥0升(x)*, y) 对于L(x,y)=f(x)+yTg(x)。从X7开始→ L(x,y)对于每个y都是凹的≥ 0我们发现每x∈ 十、 L(X,y)*) ≤ L(x,y)*) + xL(x,y)*)(十)- 十、*) ≤ L(x)*, 十、*)因为(K)保证xL(x,x*)(十)- 十、*) ≤ 0.因此(27)中的第一个等式如下。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 19:26:21
从(K)和(K),我们得到了g(x)*) ≥ 0和(y)*)Tg(x)*) = 0,从而推导出第二个等式:miny≥0升(x)*, y) =f(x)*) + 米尼≥0yTg(x*) = f(x)*) + 0=f(x)*) + (y)*)Tg(x)*) = L(x)*, Y*).4.4. 线性规划。线性规划(LP)是一个形式为(28)maxx的优化问题∈Rn+cTx s.t.Ax≤ b、 c在哪里∈ RN是一个n维系数向量,A∈ Rm×na矩阵和b∈ Rman m维系数向量。问题类型(28)是参数(1)X=Rn+,(2)f(X)=cTx=Pnj=1cjxj,(3)g(X)=b的(21)的特例- 以及拉格朗日函数l(x,y)=cTx+yT(b- Ax)=yTb+(电流互感器)- yTA)x,在变量x和y中都是凹的和凸的。最坏的情形函数是l(x)=cTx if Ax≤ B-∞ 如果Ax 6≤ b、 L(y)=yTb如果yTA≥ cT+∞ 如果yTA 6≥ 计算机断层扫描。为了标记这种特殊情况,我们将与线性程序(28)相关的拉格朗日对策称为LP对策,并用LP(c;a,b)表示。52 3。我们已经知道,最大化L(x)的p问题对应于原始问题(28)。最小化L(y)的对偶问题对应于优化问题(29)miny∈Rm+bTy s.t.ATy≥ c、 例3.5。制定一个与优化问题(29)等价的(28)型线性规划。例3.6。将随机矩阵对策(X,Y,U)中的最优策略问题表述为(28)形式的线性规划,即找到可测矩阵a和系数向量c a和b。我们从定理3.3知道,LP对策的平衡点可以计算为KKT条件的解。至于它们的存在性,基本定理3.4提供了一个无紧性的特征:定理3.4(关于线性规划的主要定理)。LPgame(c,A,b)有一个平衡点,当且仅当(28)和(29)两个问题都有可行解时。LP游戏本身并不像零和游戏那样有趣。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 19:26:27
在可能有两个以上参与方的合作博弈理论(见第7章)中,线性规划是一种结构分析工具。线性规划问题在应用中尤其重要,因为它们可以有效地解决。我们不讨论算法细节,而是参考标准数学优化文献。(另见附录第4节。)e、 g.,U.FAIGLE,W.KERN和g.STILL,数学编程的算法原理,Springer,2002年第4章投资和提高赌徒的对手通常是没有特定优化目标的玩家。对手的战略选择是由机会决定的。因此,赌徒必须决定具有良好预期回报的策略。信息在寻求最佳决策中起着重要作用。因此,如何在(可能不止两个)参与者之间建立信息交换和共同知识模型的问题也值得解决。假设投资者(或投注者、赌徒或简单的玩家)正在考虑参与某项风险投资。那么,对投资者来说,一个显而易见——尽管相当模糊——的大问题是:o应该做出什么样的决定?更具体地说,投资者希望决定一项投资是否值得,如果值得,应该投资多少钱。显然,答案在很大程度上取决于其他信息:成功的可能性是什么,预期会有什么收获?aloss的风险是什么?因此,投资者将以玩家的身份参与一场双人游戏,对手的策略和目标并不总是明确或事先知道的。投资者无法完全(或可靠)获得相关信息,因此必须在不确定的情况下做出决策。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 19:26:34
典型的icalexamples是赌博和博彩,其成功与否取决于可能发生或不可能发生的事件,因此取决于“运气”或“机会”。但是,如果事先不清楚某项投资的价值会上升还是下降,股票市场的投资也属于这一类。我们不能完全回答上面的大问题,但要讨论它的各个方面。在深入探讨更多细节之前,让我们用一个经典的——看似矛盾的——赌博情境来说明这个主题的重要性。54 4. 我在测试和完善圣彼得堡悖论。想象自己是一个潜在的玩家,在接下来的机会游戏中。例4.1(圣彼得堡比赛)。一枚硬币(有“H”和“T”两个面)被反复挤压,直到“H”出现。如果这个h出现在第n次掷骰时,参与的玩家将获得αn=2欧元。然而,aeuros的参与费是有限的。所以玩家的净增益isa=αn- a=2n- 如果游戏在第n次掷骰子时停止。参加奥运会的费用是多少?假设在圣彼得堡的比赛中有一枚公平的硬币,掷n次以上(因此第一个n次结果为“t”)的概率为qn=n=n→ 0(n)→ ∞).因此,游戏几乎肯定会在最后几次失败后结束。然而,参与者的预期回报是有限的:EP=∞Xn=1nqn=+++nn+…=+∞,这可能并不意味着玩家应该愿意为被允许进入游戏支付任何金额。然而,在实践中,这可能是arisky venture(见Ex.4.2)。例4.2。表明在圣彼得堡比赛中获得100欧元或更多奖金的概率小于1%。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 19:26:40
因此,a=100欧元或mo re的参与费似乎不具吸引力,因为其覆盖率不超过99%。矛盾的是,当我们不是直接而是通过对数logn=n来评估收益2n的效用时,圣彼得堡的收益有一个有限的效用预期:GP=log+log++lognn+=∞Xn=1nn<2。它表明,人们应该期望效用值小于2,因此回报小于2=4欧元。1.比例4.1(对数效用)。伯努利在对圣彼得堡博弈的分析中引入了对数函数来衡量财务收益的效用值。这个凹函数在我们的分析中也起着重要的作用。无论使用logx、对数基e2还是自然对数lnx,都没有任何本质区别,因为这两个函数的区别只是一个比例因子r:lnx=(ln2)·logx。1.比例投资我们的一般模型由初始投资组合B>0欧元(或美元或…)的潜在投资者组成投资机会A。投资者要决定哪部分aB(比例因子为0)≤ A.≤ 1) B的一部分应该投资,并考虑k可能的情况A,为它的发展做准备。投资者认为其中一种情况将被具体化,hermore进一步假设:(S1)如果发生AII,则每一欧元投资的回报率为ρi≥ 0欧元。(S2)场景Ai以概率pi发生。预期收益。在投资者的假设下,每投资一欧元的预期回报率为ρ=ρp+…+ρkpk。如果投资者的决策是基于预期回报的最大化,naiv投资规则适用:(NIR)如果ρ>1,将所有B投资于A,并预期回报Bρ>B。如果ρ≤ 1.不要投资,因为没有适当的收益预期。尽管规则(NIR)具有直观的吸引力,但它还是有相当大的风险。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 19:26:46
4.3).例4.3。对于k=2,求出返回率ρ=0和ρ=100。如果p=0.9和p=0.1,投资者预期投资回报率为10倍:ρ=0·0.9+100·0.1=10。然而,在概率p=90%的情况下,预计投资将以伯努利(1700-1782)56 4的总服务水平进行。测试并提高预期效用。关于对数效用函数Lnx,aB大小投资的预期效用为u(a)=kXi=1piln[(1- a) B+ρiaB)]=kXi=1piln[1+(ρi- 1) a]+lnb.U(a)的导数isU′(a)=kXi=1pi(ρi)-1) 1+(ρi)- 1) a=kXi=1pi1/ri+awith ri=ρi- 1是情景Ai中投资者对每个被投资区域的预期盈余。投资率*最优效用值必须满足‘(a*) = 因此,可以通过求解方程U′(a)=0来计算。例4.4。在ex4.3的情况下,一个hasU(a)=ln(1- a) +ln[(1+99a])+ln b与导数eu′(a)=-910(1 - a) +10(1+99a)。U′(a)=0意味着a=1/11。因此,B/11部分应该按最大化预期效用的顺序进行投资。其余的B=B- B/11投资组合应保留,不得投资。2.财富公式我们转向一个基金基本问题:o一个人是否应该投资一个机会a,该机会以概率p的ρ提供预期回报,但同时也提供概率q=1的完全损失(即零回报)-P在Ex.4.4中已经遇到了这种情况的一个特例。用r=ρ表示- 1投资的预期盈余率,通常相关的预期对数效用为2。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 19:26:53
财富公式57(30)U(a)=qln(1)- a) 带导数(31)U′(a)的+p ln(1+ra)+ln b=-q1- a+p1/r+a。如果预期损失的正概率q>1,且投资者决定进行全部投资,即选择a=1,则可用性值U(1)=-∞无论利率r有多大,都必须是预期的。另一方面,无投资的选择a=0具有效用U(0)=ln B。投资率a*在这些极端之间的某些地方存在最佳利用率。引理4.1。设U′(a)如(31)所示,0<a*< 1.ThenU′(a)*) = 0<==> A.*= P- q/r证明。(练习留给读者。)投资率的选择*最优期望对数效用U(a)*), i、 根据凯利所谓的财富公式:(32)a*= P-qrif0<p-qr<1坚定自己的信念。重要的是要记住,财富公式(32)中的概率是投资者对投资成功的主观评价。在投资时,“真实”概率通常是未知的。然而,如果反映了投资者对真实概率的最佳了解,那么投资者就没有更好的办法了。这一真理被称为投资建议,树立你的信念!J.L KELLY(1956):对信息速率的新解释,贝尔系统技术期刊58 4。我正在测试和改进。公平的奥德桑投资机会y A,回报率为ρ≥ 1欧元pereuro以一定的概率Pr(a)投资或不回报(概率1- Pr(A))被称为对A的押注。然后,投资者是投注者(或赌徒),回报ρ是回报。假设收益由收受赌注者(或银行)担保。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 19:26:59
回报率也用1:ρ表示,称为下注的od ds。赌徒的预期收益(每欧元)isE=ρPr(A)+(-1)(1 - Pr(A)=(ρ+1)Pr(A)- 1.所以(-E) 是收受赌注者的预期目标。如果赌徒和庄家的预期收益相同,即e=-因此E=0成立。换句话说:1:ρ是公平的<==> ρ =1 - Pr(A)Pr(A)如果投注者不知道真实概率Pr(A),则需要对其进行估计。假设投注者对PR(a)的期望是p,则下注(主观)有利,当且仅当(33)e(p)>0时,即,如果ρ+ 1>1/p,赌注者将考虑几率1:ρ为公平IFE(p)=0,因此ρ+1=1/p。下注者不会期望在下注时获得收益,而是期望在下注时遭受损失——基于导致概率估计p为Pr(a)的信息。3.1。例子。让我们来看一些例子。例4.5(德梅尔的游戏)。假设一个事件没有“6”显示,如果一个单六面模具滚动四次。假设A的赔率为1:1。如果赌徒认为所有结果都是相同的,则g ambler对A的概率f的估计==≈ 0.48 2<0.5参考B.PASCAL(1623-1662)3。公平的OD DS 59,因为在di e的4个Roll上有6=1296个可能的结果序列,其中5=625对应于A。因此,玩家应该期望一个负urn:e(p)=(ρ+1)p- 1=2p- 1 = 2(5/6)- 1 < 0.相比之下,如果一对骰子掷了24次,就让A成为没有双6显示的事件。现在,潜在赌徒估计Pr(~A)为~p=(35/36)>0.5。因此,A的赔率为1:1会让赌徒期待一个正确的结果:~E=2~p- 1 > 0.例4.6(轮盘赌)。设W={0,1,2。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 19:27:06
,36}表示轮盘赌,并假设0∈ W为绿色,18个数字为卫红,其余18个数字为b。假设一个数字∈ W是通过旋转轮子并让球停在其中一个数字上随机确定的。(a) 修正w∈ 事件Aw={X=W}上的ODDS1:18。在赌Aw时,阿甘布勒是否应该期待正回报?(b) 假设银行对事件R={X=red}给出1:2的赔率。赌徒是否认为这些可能性对公平?3.2. 加倍策略。对于轮盘赌(见例4.6)和赔率为1:2的类似投注游戏,大众智慧建议根据以下策略进行重复投注:(R)在R={X=red}上下注1。如果R没有出现,则继续在R上下注双倍金额2。如果R没有出现,则再次加倍,并在R上下注4,依此类推,直到事件发生。一旦R显示,一个人在原来的1号投资上的净收益为1(见Ex.4.7)。R不在一圈内发生的概率是19/37。因此,在一个同样平衡的单轮的前n个旋转中的e个旋转中看到红色的概率很高:1- (19/37)北→ 1(n)→ ∞).因此:策略(R)a很有可能实现1的净收益。我年轻时从我叔叔Max60 4那里学会了策略(R)。我在自相矛盾地期待和改进(?),在事件R上下注任何金额x>0的预期净收益始终为负,然而:ER=2x- x=-x<0。例4.7。使用平衡良好的轮盘赌游戏的展示:(1)如果仅在轮盘的第五个旋转上显示{X=red},策略(R)在前4个旋转上总共损失了15次。然而,在第五轮投资中,又投资了16项,然后赢得了2=32,这就产生了总体净回报率32- (15 + 16) = 1.(2) 前5次旋转发生{X=red}的概率大于95%。议论
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 19:27:12
战略(R)的问题在于其风险管理。一个演奏家在实践中只能得到有限的钱。如果玩家希望将损失风险限制在B欧元,那么下注序列中的迭代次数将限制在mo st k,其中k-1.≤ B<2k,因此k=日志.因此:o可用预算B以概率(19/37)k损失。o投资组合以概率1增长到B+1- (19/37)k.4。押注于其他考虑到k m共同独家活动A,Ak-1.哪一家银行提供的赔率为1:ρ离子k事件Ai,这意味着:(1)银行提供的情景中,1/ρ离子是Aito发生的概率。(2) 如果事件发生,银行保证每欧元支付ρieuros。假设一名赌徒估计事件发生的概率PI>0,并决定将资本B=1全部投入。在这种情况下,(下注)策略是k元组a=(a,a,…,ak)-1) 人工智能的数量≥ 0以至于a+a+…+ak-1= 14. 押注于备选方案61,其解释是,当i=0,1,…,时,资本的收益将押注于事件的发生,K- 1.所以赌徒预期的策略a的对数效用isU(a,p)=k-1Xi=0piln(aiρi)=k-1Xi=0piln ai+k-1Xi=0pilnρi.注意p=(p,p,…,pk-1) 这本身就是一种策略,并且U(a,p)表达式中的第二个和项不取决于a的选择。因此,当一个人以最佳预期效用搜索一个策略时,只有第一个和项才有意义。定理4.1。设p=(p,p,…,pk)-1) 是赌徒的概率评估。然后:U(a,p)<U(p,p)<==> a 6=p。因此,a*= p是在赌徒期望下具有最佳对数执行力的策略。证据函数f(x)=x- 1.- ln x定义为所有x>0。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 19:27:19
它的导数f′(x)=1- 1/xis在x<1时为负值,在x>1时为正值。所以f(x)对于x<1严格减小,对于x>1严格增大,且唯一极小值f(1)=0。这就得到了等式为(34)lnx的伯努利方程≤ 十、- 1和lnx=x- 1.<==> x=1。应用伯努利不等式,我们得出(a,p)- U(p,p)=k-1Xi=0piln-ai-K-1Xi=0piln pi=k-1Xi=0piln(ai/pi)≤K-1Xi=1pi(ai/pi)-1) =k-1Xi=1ai-K-1Xi=1pi=0且相等当且仅当ai=Pi对于所有i=0,1,K62 4. 在测试和改进OREM 4.1的过程中,得出了具有最佳预期对数效用的设定规则:(BR)对于所有I=0,1,K- 1、将资本B的端口ai=Pi赌在事件ai上。不是贝尼。比例规则(BR)只取决于赌徒的概率估计值。它与1:ρithebank可能提供的特定赔率无关!很有可能。在定理4.1的证明中,我们可以看到:-1Xi=0pilnρi=-K-1Xi=0piln(1/ρi)≥ -K-1Xi=0pilnπ,当且仅当ρi=1/所有i=0,1,K- 1.因此,银行的最佳赔率(以及赌徒的最差赔率)由(35)ρi=1/pi(i=0,1,…,k)给出- 1).在这种情况下,赌徒期望最优策略p asU(p)=k的对数效用-1Xi=0piln pi-K-1Xi=0piln(1/ρi)=0。我们理解(35)中的赔率在使用替代方案下注的情况下是公平的。4.1. 统计频率。假设前几节中的赌徒已经观察到,在n个连续的下注实例中,该事件已经多次出现。因此,在s策略a下,原始的p组合B=1会发展成N(a)=(aρ)s(aρ)s·(ak-1ρk-1) sk-1具有对数效用un(a)=ln Bn(a)=k-1Xi=0siln(aiρi)=k-1Xi=0silin ai+k-1Xi=0silnρi.5。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 19:27:25
赌博和信息63基于观察到的频率,赌徒可以根据相对频率Espi=si/n(i=0,1,…,k)合理估计事件发生的概率- 1).就像理论证明一样。1,我们现在在hindsig ht中发现:推论4.1。战略a*= (序号),sk-1/n)将导致最大对数效用值UN(a*) =K-1Xi=0siln(si/t)+k-1Xi=0pilnρi,因此最大g rowthBn(a*) =(sρ)s(sρ)s·(sk)-1ρk-1) sk-1点5分。下注和信息假设下注情况为k选项a,a,Ak-1和赔率1:ρxas之前,假设事件轴已经建立,但下注者在下注之前没有此类信息。进一步假设信息现在通过某个(人工或技术)通信通道K到达,因此ou tcome轴向投机者报告(可能错误地)为Ay:x→ K→ y、 在收到“y”信息中的“内幕消息”后,投注者应该如何下注?为了回答这个问题,letp(x | y)=当接收到y时,真实结果为x的概率。请注意,这些参数p(x | y)通常是投注者对通道K信任度的主观评估。该信息设置中的投注策略现在是A(K×K)-矩阵x A,系数为A(x | y)≥ 0表示满意-1Xx=0a(x | y)=1表示y=0,1,K- 1.a(x | y)是在收到Axy时,押注在活动上的预算部分。具体而言,系数p(x | y)为64 4的投注者信任矩阵p。我正在测试和改进策略。对于Axis为真实结果的情况,因此期望对数效用Ux(A)=k-1Xy=0p(x | y)ln[a(x | y)ρx]=k-1Xy=0p(x | y)lna(x | y)+lnρx。在推论4.1中,我们发现所有x=0,1,K- 1:Ux(A)<Ux(P)<==> a(x | y)=p(x | y)y=0,1。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 19:27:33
K-1.因此,最佳策略P是最优的(在投注者对K有一定信任的情况下),并且符合投注规则:打赌你的信念!信息传递。设p=(x,…,xk)-1) 是下注者对k事件A,A,…,的概率估计,Ak-1or,等价地,在eindex集合{0,1,…,k上-1}. 那么策略A的预期对数效用是相对于基数2:U(p)(A)=k的-1Xx=0k-1Xy=0pxp(x | y)loga(x | y)+k-1Xx=0pxlogρx.NOTA BENE。概率px是对事件Ai的可能性的估计,而概率p(x | y)是对投机者对通信信道K的可靠性的信任的估计。它们在逻辑上不相关。设定值(X)=-K-1Xi=1pxlogxH(ρ)=-K-1Xi=1ρxlogxH(X,Y)=-K-1Xx=0k-1Xy=0pxp(x | y)loga(x | y),因此我们认为-H(X | Y)- H(ρ)=U(p)+T(X | Y)6。常识65t(X | Y)=H(X)-H(X | Y)是由于通过信道K进行通信,投注者预期对数效用的增加。备注4.2(信道容量)。给定如上所述的信道K,传输概率p(s | r)和分布p=(p,p,…,pk)-1) 在信道输入x上,参数T(x,Y)是K的(信息)传输速率。在所有可能的输入分布p上最大化,得到信道容量C(K)作为可实现传输速率的最小上界:C(K)=suppT(x,Y)。参数C(K)在信息与通信理论中起着重要作用。例4.8。投注者预期该事件的概率为80%,而备选事件的概率为20%。应该下什么赌注?假设现在一位专家告诉bett或Ais肯定会发生。在专家被认为是正确的概率为90%的假设下,投注者应该下什么赌注?6.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 19:27:39
公共知识在讨论了有关博彩的信息之后,让我们离题一点,对信息和知识有一个更一般的看法。考虑到系统S,我们要问:在多大程度上,一组代理人的共同知识会影响关于系统状态的个人结论?为了解释我在这里的意思,我们首先讨论一个众所周知的谜语。C.E.SHANNON(1948):通信的数学理论。贝尔系统工程66 4。我正在测试和改进。1.红白相间的帽子。想象一下下面的情况:(I)三个戴着红帽子的女孩,G,G,正在围成一个圈。(二) 他们都知道他们的帽子不是红色就是白色。(三) 每个人都能看到所有帽子的颜色,除了她自己的。现在老师来宣布:(1)至少有一顶红帽。(2) 我会慢慢数数。一旦有人知道她帽子的颜色,她就应该举手。会发生什么?老师提供的信息是否超出了IRL已经掌握的常识?毕竟,每个女孩都看到两个红帽——因此知道其他女孩至少也看到一个红帽。因为(III),女孩们知道她们的帽子宇宙S处于8种可能的颜色分布状态之一:∑∑∑∑∑∑∑∑∑∑∑∑GR R W W W W WGR W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W。他们共同知识的熵是:H=log8=3。教师的声明h However排除了状态σ,并将熵降低到h=log7<h,这意味着教师提供了适当的额外信息。在老师的第一次计数中,没有一个女孩能确定自己的帽子,因为没有人看到两顶白色的帽子。所以没有举手,我排除了统计σ,σ和σ的可能性。现在用π(σ)表示,当hat分布实际上是σ时,π认为可能的状态集。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 19:27:45
我们有,例如,P(σ)={σ},P(σ)={σ},P(σ)={σ}。因此,在每种状态σ、σ、σ中,至少有一个女孩会在第二次计数时举手,并断定她的帽子是红色的,这将向其他女孩发出状态(以及帽子分布)的信号。5.如果在第二个国家没有举手,所有的女孩都知道自己处于σ状态,并会在第三个国家举手。共同知识67的对比,考虑极端的场景和假设:(i’)三克ILLS,G,Gand G,与白色帽子坐在一个圆。(二) 他们都知道他们的帽子不是红色就是白色。(三) 每个人都能看到所有帽子的颜色,除了她自己的。老师宣布的效果完全不同:o每个女孩都会立即断定自己的帽子是红色的,并举起手,因为她只看到其他女孩身上的白色帽子。该分析表明:(i)老师提供的信息是主观的:即使信息(“至少有一顶红帽”)是虚假的,女孩们最终会确信她们知道自己帽子的颜色。(ii)当一个女孩认为她知道自己帽子的颜色时,她可能得出了一个事实上错误的结论。例4.9。假设三个女孩身上任意分布着红白相间的帽子。然而,老师的声明会让女孩相信他们知道自己帽子的颜色吗?6.2. 信息和知识功能。系统中的事件是E的子集 美国的许多州。我们说E发生在S处于σ状态时∈ E.表示所有可能事件的集合,我们认为是函数P:S→ 具有σ性质的2s∈ P(σ)表示所有σ∈ Sas是一种信息功能。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 19:27:51
P的解释是:o如果S处于σ状态,则P提供事件P(σ)发生的信息。注意P不一定是尖锐的:任何状态τ∈ P(σ)是信息函数P下真实状态的候选者。信息函数P定义了知识函数K:2S→ 2siak(E)={σ| P(σ) E} 对于积分:oK(E)是状态σ的集合∈ 其中P表示事件确实发生了。68 4. 测试和改进引理4.2。信息函数P的知识K有七个性质:(K.1)K(S)=S(K.2)e F==> K(E) K(F)。(K.3)K(E)∩ F)=K(E)∩ K(F)。(K.4)K(E) E.证据。简单的练习,留给读者。属性(K.4)是所谓的可靠性公理:如果一个人知道(在K下)E已经发生,那么E真的发生了。例4.10(透明度)。验证所有事件E的透明度公理(K.5)K(K(E)=K(E)。解释:当一个人确信E已经发生,那么一个人确信他认为E已经发生。我们说,如果E=K(E)为真,E是明显的,这意味着:o知识函数K认为一个明显的事件E已经发生,当且仅当E真的发生了。例4.11。展示:所有可能状态的集合总是一个明显的事件。例4.12(智慧)。验证所有事件E的智慧公理(K.6)S\\K(E)=K(S\\E)。解释:当一个人不确定地知道E已经发生,那么他就知道自己的不确定性。6.3. 共同的知识。现在考虑np={p,…,pn}的nPipe PIN与各自的信息函数PI。我们说事件 如果E对N的每个成员都是明显的,那么S对N是明显的,即ifE=K(E)=Kn(E)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 19:27:57
常识69更一般地说,事件E 如果有一个事件F,则S被认为是状态σ中N的公知 E使得f对于N和σ是明显的∈ F.建议4.1。如果事件 S是当时玩家的常识,信息函数为π,然后为σ∈ Ki(Ki(…(Kim(E))…)适用于所有序列i。imof指数1≤ ij≤ n、 证据。如果事件E是公知的,则它包含明显的事件F E与σ∈ F从定义上讲,我们有∈ 基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基根据知识函数(引理4.2)的性质(K.2),我们由此得出(Ki(…(Kim(E))…) 基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基F σ.作为命题4.1的说明,考虑EngSK(E)、K(K(E))、K(k(k(e)))。K(E)是所有的状态,在这些状态下,玩家pis确信E h已经发生。集合K(K(E))包括玩家pis确定playerp(E)确定E已经发生的那些状态。在K(K(K(E))中,是所有的状态,玩家pis确信玩家pis确信玩家P相信E已经发生。等等6.4. 不同的意见。L et和pbe两个具有通知功能的参与者,并假设:两个参与者对事件E的发生具有相同的概率估计Pr(E) 我们转向这个问题:o在某种状态下,这两个参与者之间是否有共同的知识*他们对事件发生的可能性的估计是否不同?令人惊讶的是(?),答案可以是“是”,如例4.13所示。对于本例中的分析,回想一下事件A的条件概率是70 4。测试和改进(E | A)=Pr(E)∩ A) /Pr(A)如果Pr(A)>00如果Pr(A)=0。例4。1 3.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群