全部版块 我的主页
论坛 经济学人 二区 外文文献专区
2022-5-8 10:28:59
以下命题给出了这一观察结果的两个显著应用。我们采用了一种惯例,即Fdenotes是一个累积分布函数(CDF)。回想一下,我们用∞.提议4。当| Y |∈ N、 每一处房产都有elicC(Γ)≤ |Y|- 1所有C 克林。证据假设Y={Y,…,yn},分布p由其第一个n唯一确定- 1组分p(y),p(yn)-1) ,每个都可以作为线性性质p(y)=EpY=y导出。提议5。当Y=R时,每个属性Γ都有elicC(Γ)≤ ∞ 不管怎样,C 克林。统计性质的启发复杂性。因为一个分布是由它在稠密集上的CDF值决定的,所以让{qi}i∈Nbe是有理数的枚举,定义^Γ(F)i=2-如果(气)。因为^Γ是平方和的,所以我们有^Γ∈ Clin,cf.用命题2的证明进行讨论,并引出byL({ri}i∈N、 y)=Pi∈N(ri)- 2.-艾伊≤气)。通过适当的链接,我们可以计算Γ。上面对Y的限制可以很容易地放在P上。例如,有限Y等价于在Y=R的有限子集上有支撑的P。特别是,命题4和命题5适用于恒等式性质Γid(P)=P,正如我们现在转向下界所示,在温和条件下,它们给出的下界是紧的。4·4. 特定属性的下界:期望值和数量一类经过充分研究的属性是一些向量值随机变量的期望值集,通常称为线性情况。所有这些属性都是可引出和可识别的(Savage,1971;Abernethy&Frongillo,2012;Frongillo&Kash,2015),复杂性受随机变量的维数限制,但如果Γ的范围不是全维的,复杂性当然可以更低。在下面的内容中,让a off dim表示a off外壳的尺寸。引理5。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 10:29:02
让我们来看看→ Rkbe P-可积,k∈ N、 设Γ(p)=Ep[φ(Y)]。然后elicC(Γ)=a off dimΓ(P),对于任何满足C的临床,Γ范围内的蜗壳的尺寸 C I.分位数是另一个重要的例子:对于充分丰富的分布集,不同的分位数是独立和平衡的,因此它们的启发复杂性是被证实的分位数的数量。这里我们把C=I作为损失,得出分位数不能是严格凸的;见§3.4。与预期一样,如果分布集不够丰富,则可以降低启发复杂性。我们陈述了P为“富”条件的两个版本。例如,这些条件由一元高斯分布的所有混合物的集合来满足。条件2。让k∈ N被给予。为了所有的x∈ [0,1]k,存在r,rk∈ R这样x∈int{(F(r),…,F(rk))>:F∈ P} Rk。条件3。让k∈ N被给予。存在一个P-可积函数φ:Y→ Rkwitha off dim{Ep[φ(Y)]:p∈ P} =k。这两个条件都可以作为特殊情况,将条件1应用于α-分位数V(r,y)=1y的识别函数的各种r选择≤R- α、 orV(r,p)=F(r)- α. Fissler和Ziegel(2016)的假设V1再次暗示了条件3。通过考虑φ(y)i=1y,条件2意味着条件3≤里。引理6。对于Y=R,设P §3.4中定义的Pq,对于某些k,满足条件2∈ N.对于所有不同的α,αk∈ (0,1),我们有elicI({qα,…,qαk})=k,其中qα是α分位数函数。尤其是分位数的例子,让我们看到所有复杂度类别,包括∞,他们都有空。事实上,从§3·3中的例子中,我们可以看到,即使对于实值房地产Γ:P→ R、 所有班级都有人。回想一下,条件2意味着条件3。提议6。设P满足条件3或条件2,对于所有k∈ N
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 10:29:06
那么不管怎样∈N∪ {∞} 存在一个性质γk:P→ 对于任何满足条件的C,具有elicC(γk)=k的R C 一、证据。Y:Y→ Rk是条件3中的随机变量,我们可以取γk(p)=kEp[φ(Y)]kby的推论8。案例k=∞ 根据推论2。我们现在给出命题4和命题5的匹配下界,指出当P足够丰富时,通过可识别属性实现整个分布的复杂性是最大的。这一观察结果与备注4一致,我们在备注4中看到,当C太大时,elicC(Γ)=1。引理7。让我们来看一看:P→ P、 Γid:p7→ p、 以下内容适用于所有临床试验 C I.如果Y是有限的,则elicC(Γid)=a off dim P;特别地,如果P是概率单纯形,那么elicC(Γid)=Y |- 1.如果Y=R,且有很多k∈ N满足条件2或3,则elicC(Γid)=∞.16 R.Frongillo和I.A.KashProof。对于| Y |<∞, 观察Γidis线性并应用引理5。对于Y=R,假设P满足条件2或3,则在命题6的证明中定义γkas;由于Γid定义了所有属性,引理4给出了elicC(Γid)≥ elicC(γk)=k。我们现在有elicC(Γid)≥ k代表所有人k∈ N、 和elicC(Γid)≤ ∞ 来自提案5。5.引出贝叶斯风险5·1。上界对于上界,我们显式地构造了可表示为随机变量{Xa}a的索引集的点最小值的性质的损失∈A、 γ:P→ R、 γ(p)=mina∈AEp[Xa]。(11) 当然,一个重要的特例是贝叶斯风险。回想一下,损失函数的Bayes风险l:a×Y→ R定义为L(p):=infa∈AL(a,p)。有趣的是,我们的构造并没有直接引出最小值,而是作为最小值和实现该值的指数的联合引出。损失函数采用损失的形式,由此引出线性性质P7→ Ep[Xa],除了这里的指数a不是固定的,但也可以导出。定理3。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 10:29:09
让{Xa}a∈Abe是一组P-可积随机变量,由a索引 Rk,k∈N∪ {∞}. 如果所有p均达到infaEp[Xa]∈ P、 然后损失函数l((r,a,y)=H(r)+H(r)(Xa(y)- r) (12)引出集值性质^Γ:p7→ {(γ(p),a):Ep[Xa]=γ(p)},其中γ在(11)中定义,h:γ(p)→ R+是任何严格递减函数,对于某些R,H(R)=Rrrh(x)dx∈ γ(P)。证据用增益代替损失,我们将给出等价的结果,即s((r,a),y)=g(r)+dgr(Xa)- r) 导出了^Γ:p7的组合属性→ {(γ(p),a):Ep[Xa]=γ(p)}表示γ(p)=maxaEp[Xa]。这里g是一个凸函数,具有严格递增的正次梯度dg。对于任何固定的a,我们通过次梯度不等式,S((r,a),p)=g(r)+dgr(Ep[Xa]- r)≤ g(Ep[Xa])=S((Ep[Xa],a),p),当dg严格增加时,g是严格凸的,因此r=Ep[Xa]是唯一的最大化子。现在让S(a,p)=S((Ep[Xa],a,p),我们有argmaxa∈A~S(A,p)=argmaxa∈Ag(Ep[Xa])=argmaxa∈AEp[Xa],因为g严格地增加。我们现在有了Argmaxa∈A、 r∈RS((r,a,p)=n(Ep[Xa],a):a∈ 阿格马克萨∈我们简要地提到了文献中出现的定理3的各种形式。最近,Jonas Brehmer(2017)的硕士论文中独立出现了类似的结果。Fissler和Ziegel(2016)关于预期短缺的损失函数是定理3的一个特例,事实上,对前者的仔细检查为后者提供了灵感。Peter Gr–unwald(1999;2008)的早期工作在最小描述长度原则的背景下给出了定理3的一个版本;在这里,描述长度是根据给定的损失函数和参数β定义的,对于某些“简单”的损失类别,使描述长度最小化的β值正是给定损失的Bayes风险。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 10:29:12
最后,在我们工作的同时,Fissler和Ziegel(2019a)给出了风险范围值的构造,这促使对表(11)中最小期望的线性组合进行更一般的构造;见§3.4。统计性质的引出复杂性17证明我们的主要定理的上界,即引出k维性质的损失的Bayes风险本身是(k+1)-可引出的,这是定理3的直接推论。具体来说,如果损失为L:Rk×Y→ R引出Γ:P→ Rk,我们简单地让Xa=L(a,Y),这样点态最小值就变成了Bayes风险γ(p)=L(p);定理3指出,只要(L,Γ)∈ C、 我们有elicC(L)≤ k+1。Bayes风险的定义在L引出Γ时达到极限。推论6。如果L:Rk×Y→ R引出Γ:P→ Rk,k∈ N∪ {∞}, 然后是lossL*(r,a,y)=L(a,y)+H(r)+H(r)(L(a,y)- r) (13)引出{L,Γ},其中h:r→ R+是任何正的严格递减函数,H(R)=Rrh(x)dx,并且Lis是任何其他弱引起Γ的损失。If(L,Γ)∈ C、 elicC(L)≤ k+1。为了说明上界,让我们回到方差示例。以Xa=(Y)为例- a) 是损耗的平方,所以γ(p)=minaEp[(Y- a) ,因为平方损失通过平均值a=Ep[Y]最小化,所以我们有γ(p)=Ep[(Y- Ep[Y])]=Var(p)。因此,定理3说明^Γ:p7→ (Var(p),Ep[Y])是可引出的。推论6更直接:损失的平方L(r,y)=(r- y) 求出任意性质C的平均值,L(p)=Var(p),其中(Var,E[y])∈ C.我们有风险资本(Var)≤ 2.有趣的是,我们没有(Var,E[Y])∈ Clin,但如§3.2所述,在前两个时刻,Clin的上限仍然有效。在这一节中,我们还说明定理3并没有刻画所有可能的损失函数,从而得出联合性质^Γ。5·2。下限我们现在转向下限。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 10:29:15
第一个观察结果是L是凹的,因此不太可能直接导出,因为L的水平集可能是非凸的。然而,要显示大于1的下限,我们需要更强的技术。特别是,虽然我必须保持冷静,但严格来说可能不是这样。事实上,我必须介于任何两个分布之间,这两个分布共享一个极小值。对于我们的下界至关重要的是,当两个分布之间的L差的极小值出现时,L在它们之间本质上是严格凹的。引理8。假设损失L和Bayes风险L引出Γ:P→ R.那么对于任何p,p∈ P与Γ(P)6=Γ(P),我们有L(λP+(1)- λ) p)>λL(p)+(1- λ) L(p)表示所有λ∈ (0, 1).我们现在可以证明我们的主要下界,即导致Γ的损失的Bayes风险具有复杂性,至少是Γ的复杂性。论证的结果表明,如果我们通过一些^Γ间接得出Bayes风险,那么^Γ必须通过引理8重新定义Γ,结果如下。定理4。设一类性质C。如果L引出Γ,并且定义了elicC(L),则elicC(L)≥ elicC(Γ),当L=f时相等o 对于一些函数f.证明。让`=elicC(L),这样我们就有了一些∈ E`∩ C和g:R`→ R使得L=go^Γ.我们用矛盾的方式证明了^Γ定义了Γ。否则,我们就有了p,p与^Γ(p)=^Γ(p),以及L(p)=L(p),但是Γ(p)6=Γ(p)。引理8会给我们一些pλ=λp+(1)- λ) pwithL(pλ)>L(p),但由于命题1的水平集^Γ^稀有凸,我们将有Γ(pλ)=Γ(p),这意味着L(pλ)=L(p)。因此,^Γ必须定义Γ,因此通过引理4,elicC(L)=`≥ elicC(^Γ)≥elicC(Γ)。如果L=fo Γ然后Γ定义L,所以我们还有elicC(Γ)≥ 埃利奇(左)。我们现在重申并证明我们的主要定理。定理1。让L:Rk×Y→ R是引起Γ:P的损失函数→ Rk,k∈ N∪ {∞}, 我将承担它的Bayes风险。If(L,Γ)∈ C和elicC(Γ)=k,然后elicC(L)∈ {k,k+1}。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 10:29:19
此外,lossL*(r,a,y)=L(a,y)+H(r)+H(r)(L(a,y)- r) 引出{L,Γ},其中h:r→ R+是任何正的严格递减函数,H(R)=Rrh(x)dx,以及任何其他弱引起Γ18 R.Frongillo和I.A.KashProof的损失。推论6给出了损失的形式和上界elicC(L)≤ k+1。对于lowerbound,定理4和假设elicC(Γ)=k给出了elicC(L)≥ elicC(Γ)=k。5·3. 特定属性类别的界限我们现在转向c类特定选择的结果。首先,当c 一、 我们认为最薄弱的阶层。这种专门化是有用的;通常,定理4最困难的要求是显示elicC(Γ)=k,但当C I.进一步收紧elicC(L)的下限≥ elicC(Γ)+1,wee基本上必须排除L是Γ链接的情况。这个案子确实发生了;例如,从平方损失中删除yterm得到L(x,y)=x- 2xy和L(p)=-Ep[Y],对于任何合理的C选择,它的elicC(L)=1,例如,C=I。为了排除这种情况,我们假设L在满足条件1的某个水平集Γ上不是常数。然后证明了如果elicI(L)=elicI(Γ),L的某个水平集必须包含Γr,这是一个矛盾。它还表明我们可以替换条件(L,Γ)∈ C由Γ∈ 一、推论7。让我引出一些∈ Ik(P),k∈ N.如果Γ定义了L,则elicI(L)=k。如果Γ满足条件1,则某些r∈ Γ(P)和L在Γr上是非常数,那么elicI(L)=k+1。现在,我们重申并证明命题3,这是我们在应用中广泛使用的。提议3。让L:Rk×Y→ R是一种引起Γ的损失∈ Ik,k∈ N.如果Γ满足某些r的条件1∈ Γ(P),L在Γr上是非常数,那么elicI(L)=k+1。如果另外(L,Γ)∈ C代表一些C 一、 然后elicC(L)=k+1。证据第二种说法来自推论7。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 10:29:22
第三个来自定理4和命题2,给出了elicC(L)≥ 伊莱西(左)。现在我们来讨论严格和强凸损失的上界和下界。我们在补充材料中提供了完整的处理方法。在这里,我们陈述了关于stronglyconvex损失的主要结论;严格凸性的结果类似,但需要一些额外的假设。提议7。让我们∈ Cstrong,Γ:P→ Rk,k∈ N、 由一个可微的、有界的、强凸的L引出。如果Γ满足某些r的条件1∈ Γ(P),L在Γr上是非常数,那么elicCstrong(L)=k+1.6。讨论和开放性问题如上所述,我们关于省略复杂性的概念,定义4,建立在Lambert等人(2008)和其他工作的基础上。我们认为,我们的定义最适合于研究合理属性的难度:将f视为一个潜在的降维链接函数,我们的定义适用于相关属性的点估计或经验风险最小化所需的最小维度数,然后是f的简单一次性应用。为了与文献中的其他定义进行比较和进一步讨论,请参见§E。启发复杂性中的许多自然问题仍然存在。最明显的是复杂性类{Γ:elicC(Γ)=k}的特征,尤其是确定不可诱导属性的诱导复杂性。例如,在我们的工作之后,模式的复杂性被证明是有限的(Dearborn&Frongillo,2019),而最小预测区间的复杂性仍然是开放的(Frongillo&Kash,2014)。我们在下面确定了其他未来的方向。更严格地描述Bayes风险。考虑一个损失L引出引出引出复杂性k的一些性质Γ。直觉上,推论7表示Bayes风险Lis k+1的引出复杂性,除非L恰好是Γ的一个链接。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 10:29:27
然而,我们缺乏对L=f的性质的描述o Γ对于一些链接f和一些链接L,引出Γ。我们推测,只有当Γ是线性性质的链环时,这种关系才可能存在,即对于某些可逆的Γ和任意的g,Γ(p)=Γ(Ep[g(Y)]。根据直觉,L(p)必须沿Γ的水平集具有零斜率。一般凸损失统计性质的启发复杂性。在整篇论文中,当处理凸损失时,我们坚持认为它们是光滑的和严格凸的。一个重要的未来方向是研究由任何凸损失引起的性质的自然类。我们的结果不适用于此类,因为我们的下限基本上依赖于可识别性,即C 一、 而Ccvx6 I.备注4表明,CCVx类的限制性足以防止所有属性Γ的Eliccccvx(Γ)=1(Ramaswamy等人,2013)。虽然ELICCCVX的一些结果出现在机器学习文献中,但对于分类或排名等设置(Bartlett等人,2006年;Ramaswamy等人,2013年)和一些更一般的结果(Ramaswamy&Agarwal,2013年;Agarwal&Agarwal,2015年),严格的界限通常仍然难以确定。条件启发。另一个有趣的方向是条件启发:只要其他一些可启发属性的值已知,这些属性就是可启发的。Emmer等人(2015)提出了这一概念,他们表明方差和预期短缺都是有条件的,分别基于平均Ep[Y]和分位数qα(p)。直觉上,知道Γ是可引出的条件于一个可引出的Γ,可能意味着这对{Γ,Γ}是合理的;Fissler和Ziegel(2016)这是一个悬而未决的问题,即这种联合的可激发性是否以及何时普遍存在。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 10:29:31
从我们的结果中,我们现在看到了一类广泛的性质,这种联合可测性确实成立:贝叶斯风险L,损失L引出Γ,是可引出的,条件是Γ,对{Γ,L}是可由定理3联合引出的。然而,我们在图2中给出了一个反例,其中的一个属性是有条件可导出的,但不是联合可导出的。致谢我们要感谢陈怡玲、克里斯蒂娜·迪尔伯恩、杰西·菲诺基亚罗、托比亚斯·菲斯勒、蒂尔曼·格尼廷、彼得·格伦沃尔德、尼古拉斯·兰伯特、英戈·斯坦瓦特、波·瓦格纳、若杜旺、延斯·维特科夫斯基和约翰娜·齐格尔,感谢他们提供了有益的评论、讨论和参考。Wethank匿名评论者对备注3中的见解和引理4中的属性对进行了分析。这项工作部分由国家科学基金会CCF-1657598资助。参考Abernethy,J.和Frongillo,R.(2012)。线性属性评分规则的特征。在第25届学习理论大会上。阿加瓦尔,A.和阿加瓦尔,S.(2015)。关于一致性代理风险最小化和属性启发。在学习理论会议上。Ang,M.,Sun,J.和Yao,Q.(2018)。关于一致性风险度量的双重表示。运筹学研究年鉴26229-46。Arora,S.,Babai,L.,Stern,J.和Sweedy,Z.(1993年)。格、码和线性方程组中近似最优解的难易程度。计算机科学基础。班纳吉,A.,郭,X.和王H.(2005)。关于条件期望作为Bregman预言器的最优性。IEEE信息论学报512664–2669。Bartlett,P.L.,Jordan,M.I.和McAuliffe,J.D.(2006)。凸性、分类和风险界限。《美国统计协会杂志》101,138–156。Bellini,F.和Bignozzi,V.(2015年)。关于可引出的风险度量。定量金融15725–733。Ben Tal,A.和Teboulle,M.(2007)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 10:29:34
凸风险度量的一个古老的新概念:优化确定性等价物。数学金融17449–476。比林斯利,P.(2008)。概率和测度。约翰·威利父子公司。布雷默,J.R.(2017)。启发性及其在风险管理中的应用。曼海姆大学硕士论文。Casalaina Martin,S.,Frongillo,R.,Morgan,T.和Waggoner,B.(2017)。多重观测。第30届学习理论会议论文集。K.迪尔伯恩和R.弗隆吉洛(2019年)。论语气和情态间隔的间接诱导性。统计数学研究所年鉴,1-14。Delbaen,F.(2002年)。广义概率空间上的一致风险测度。在金融和随机科学方面的进展。斯普林格,第1-37页。埃默,S.,克拉茨,M.和塔什,D.(2015)。实践中最好的风险度量是什么?标准度量的比较。《风险杂志》18,31–60.20 R.Frongillo和I.A.KashFissler,T.,Ziegel,J.和Gneiting,T.(2016)。预期短缺与回溯测试的价值风险影响是可以共同得出的。风险杂志。Fissler,T.和Ziegel,J.F.(2016)。高阶可诱导性和Osband原理。《统计学年鉴》441680-1707。Fissler,T.和Ziegel,J.F.(2019a)。风险范围值的可引出性。arXiv预印本arXiv:1902.04489。Fissler,T.和Ziegel,J.F.(2019b)。评分函数的顺序敏感性和等变性。《电子统计杂志》131166–1211。F–ollmer,H.和Schied,A.(2004)。随机金融:离散时间导论。F–ollmer,H.和Weber,S.(2015)。资本确定风险度量的公理化方法。金融经济学年度回顾7。弗隆吉洛,R.和卡什,I.(2014)。通过凸分析的一般真实性描述。在网络和互联网经济学中。斯普林格。弗隆吉洛,R.和卡什,I.(2015)。向量值属性启发。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 10:29:38
在第28届学习理论会议记录中。弗隆吉洛,R.,梅塔,N.A.,摩根,T.和瓦格纳,B.(2019年)。多元观察回归。在第22届国际艺术情报和统计会议上。Gneiting,T.(2011)。制定和评估点预测。美国统计协会杂志106746-762。Gneiting,T.和Raftery,A.E.(2007)。严格正确的评分规则、预测和评估。《美国统计协会杂志》102359–378。格伦沃尔德,P.(1999)。将所有模型视为“概率”。在《计算学习理论第十二届年会论文集》中。ACM。葛兰沃尔德,P.D.(2008)。高斯已经用过的那个简单的装置。Festschrift纪念乔玛里萨宁75岁生日,293-304岁。海因里希,C.(2013)。功能模式是不可导出的。Biometrika 101245–251。Herrmann,K.,Hoffert,M.和Mailhot,M.(2018)。多元几何期望值。《斯堪的纳维亚国家学报2018》,629-659。赫巴塞克,K.和杰赫,T.(1999年)。集合论导论,第三版。华润出版社。兰伯特,N.(2018)。统计预测的启发和评估。预印本。兰伯特,新南威尔士州,宾诺克,D.M.和肖厄姆,Y.(2008)。引出概率分布的性质。第九届ACM电子商务会议记录。新南威尔士州兰伯特和Y.肖厄姆(2009)。对多项选择题给出真实的答案。参加第十届ACM电子商务会议。纽伊,W.K.和鲍威尔,J.L.(1987)。不对称最小二乘估计和检验。计量经济学:计量经济学学会杂志55819–847。奥斯班德,K.H.(1985)。为更好的成本预测提供激励。加州大学伯克利分校。拉马斯瓦米,H.G.,阿加瓦尔,S.和特瓦里,A.(2013)。低RankLoss矩阵的凸校正替代项及其在子集排序损失中的应用。在神经突中,pp。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 10:29:41
1475–1483.拉马斯瓦米,H.G.和阿加瓦尔,S.(2016)。多类损失矩阵的凸校正维数。机器学习研究杂志17397–441。Rao,C.R.(1984年)。熵函数的凸性和多样性分析。课堂讲稿Nograph系列,68-77。Rockafellar,R.T.和Royset,J.O.(2013)。超分位数及其在风险、随机变量和回归中的应用。在理论上,受流动应用的驱动,第151-167页。Rockafellar,R.T.和Royset,J.O.(2018)。超分位数/CVaR风险度量:二阶理论。运筹学年鉴262,3-28。Rockafellar,R.T.,Royset,J.O.和Miranda,S.I.(2014)。超分位数回归,应用于模糊可靠性、不确定性量化和条件风险值。欧洲运筹学杂志234140-154。Rockafellar,R.T.和Uryasev,S.(2013)。风险管理、优化和统计估计中的基本风险四边形。Oper中的调查。瑞奇。和管理科学。18, 33–53.萨维奇,L.(1971)。引出个人的可能性和期望。JASA 66783-801。I.斯坦瓦特和A.克里斯曼(2008)。支持向量机。斯普林格。I.斯坦瓦特,C.帕辛,R.威廉姆森和张S.(2014)。财产的引出和识别。第27届学习理论会议记录。Stewart,G.(1991)。奇异值分解的摄动理论。SVD和信号处理II,算法,分析和应用,99-109。Urruty,J.-B.H.和Lemar\'echal,C.(2001年)。凸分析基础。斯普林格。王瑞伟(2018)。具有凸水平集的风险泛函。可通过SSRN 3292661获得。王瑞杰,J.F.(2015)。可引出的失真风险度量:一个简明的证明。统计与概率字母100172-175。齐格尔,J.F.(2016)。连贯性和启发性。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 10:29:44
数学金融26901–918。统计特性的启发复杂性21A。命题2在k=∞, 我们解释R∞在命题陈述中称为“序列空间”,并要求在Cstrict中具有可微性。我们四类中的属性必须具有平方可和的值,这一限制对于证明中的损失L很重要,例如具有Clin Cstrong。证据让我们∈ Clin,所以对于某些φ,Γ(p)=Ep[φ(Y)]。承担损失L(r,y)=krk-2r·φ(y),在r的(假设有界)域上是可微的和Lipschitz连续的,并且是强凸的,常数u=2,显示出Γ∈ Cstrong。包容是不可能的 从定义开始,Cstrictis立即生效。最后,设L(r,y)是一个可微的、Lipschitz连续的、严格凸的损失函数,由此导出Γ。让V(r,y)=rL(r,y),wehaveΓ(p)=r==> rEpL(r,Y)=0。由于L是Lipschitz连续的,支配收敛定理给出了rEpL(r,Y)=0<==> EprL(r,Y)=0。相反,由于EpL(r,Y)是严格凸的,我们有rEpL(r,Y)=0意味着r的最优性,这反过来又给出了Γ(p)=r。这表明Cstrict 一、 这就完成了包裹体链。如Γid∈ Clin,每个属性都是Γid的链接,相应的复杂性都得到了很好的定义,不平等性紧接着从包裹体开始。B.第3B·1节中省略的材料。定理2的证明我们陈述并证明了一个更强的结果,它为损失函数提供了一种形式。下面给出的损失函数的范围与Fissler和Ziegel(2019a)的发现相匹配;见§B·3。该公式(§B·1)是对定理1的直接修改,增加了min(0,αi)项,以确保Li的系数始终为正。定理5。每一次我∈ {1,…,m}让李:Rki×Y→ R是引起Γi:P的损失→ Rki和Bayes risk Li。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 10:29:49
对于αi,设γ(p)=Pmi=1αiLi(p)∈ R\\{0}。然后是lossL*((r,a,…,am),y)=mXi=1Li(ai,y)+mXi=1(h(r)αi- c min(0,αi))Li(ai,y)+H(r)- h(r)relicits{γ,Γ,…,Γm},其中c>0,h:r→ (0,c)是严格递减的,H(r)=Rrh(x)dx,对于每个i,li是弱引出Γi的任何损失。特别是,如果{γ,Γ,…,Γm}∈ C、 elicC(γ)≤Pmi=1ki+1。证据让我们首先解开Li(ai,y)的系数cio,它由ci给出:=h(r)αi- c min(0,αi)=(h(r)αiαi≥ 0(h(r)- c) αiαi<0。我们有h:R→ (0,c),我们在这两种情况下都看到ci>0。对于每个i,涉及aiareLi(ai,y)+ciLi(ai,y)的术语,因此构成了一个引发Γi的损失函数。因此,对于r的每一个执行值,预期损失EpL*((r,a,…,am),Y)通过对所有i取ai=Γi(p)来唯一最小化。证明r的最小值为γ(p)的剩余部分直接来自定理3的证明。B·2。光谱风险度量的复杂性让PSE成为任何一系列具有明确预期的分布,以便∈ R有一些p∈ 在[a]中包含的支持下,∞). 帕累托分布就是这样一个家庭的例子。设P包含Ps中所有分布的混合物。我们将证明,对于任何α<···<αk,有两个分布P,P的qαi(P)=qαi(P),但ρu(P)6=ρu(P)。直觉很简单:22 R.Frongillo和I.A.Kashmodify分布p超过其最后一个分位数qαk(p),方法是将质量移向增加的值,从而保持分位数不变,但增加尾部的预期值。设pbe为Ps的任意分布的混合物,设αk+1为αk<αk+1<1,取a>qαk+1(p)。让pbe在[a]上支持PSE中的任何分发,∞), 取p=(αk/αk+1)p+(1)- αk/αk+1)p。通过构造,我们得到了qαk(p)=qαk+1(p)<a。构造pwe将简单地用更高平均值的分布代替pwe,这不会修改相关的分位数。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 10:29:52
为此,设a=1+Ep[Y],设p∈ 在[a]的支持下,∞), 取p=(αk/αk+1)p+(1)- αk/αk+1)p。通过与上述相同的逻辑,我们得到了qαk(p)=qαk+1(p),这意味着所有i的qαi(p)=qαi(p),因为分布仅在区间[a,∞) a>qαk(p)=qαk(p)。然而,请注意,我们确实有Ep[Y]>a=Ep[Y]。将ESα解释为Y的期望值,条件是超过α分位数,我们得到了ESαi(p)=(αk/αk+1)ESαi(p)+(1)- αk/αk+1)Ep[Y]<(αk/αk+1)ESαi(p)+(1- αk/αk+1)Ep[Y]=ESαi(p)。由于上面的构造适用于我们选择的任何分位数向量,对k+1组系数βifor进行构造,其中αiis在内部,给出了条件1和推论3。B·3。预期短缺损失和Risk Corolution 6的范围值为我们提供了一大系列损失,这些损失导致{ESα,qα}。让Lα(a,y)=α(a)-y) 1a≥Y- a、 我们有ESα(p)=infa∈RLα(a,p)。因此我们可以取L((r,a,y)=L(a,y)+H(r)+H(r)(Lα(a,y)- r) ,(14)其中h(r)为正且严格递减,h(r)=Rrh(x)dx,L(a,y)为任何其他损耗qα,其完整特征在Gneiting(2011,定理9)中给出:L(a,y)=(1a)≥Y- α) (f(a)- f(y))+g(y),(15)其中f:R→ R是不可减的,g是任意P-可积函数。另外,Gneiting(2011)假设为L(x,y)≥ 0,L(x,x)=0,L在x中是连续的,当y6=x时,dL/dx在x中存在且是连续的;我们加g是因为我们不规范化。因此,损失形式如下:L((r,a),y)=(1a)≥Y- α) (f(a)- f(y))+αh(r)1a≥y(a)- y)- h(r)(a+r)+h(r)+g(y)。将我们的损失系列L((r,a),y)与Fissler&Ziegel(2016,Cor.5.5)给出的特征进行比较,我们发现我们恢复了这种情况下所有可能的分数,至少在限制到定理5.2(iii)中所述假设的情况下是如此。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 10:29:56
然而,请注意,由于ESα符号的不同约定,其损失由L给出((-x、 x),y)。统计性质的启发复杂性23同样地,我们从定理2中得到的关于RVaRα,β的损失如下所示,其中F,fare不减损,g是一个任意的P-可积函数。L*((r,a,a),y)=(1a)≥Y- α) (f(a)- f(y))+(1a≥Y- β) (f(a)- f(y))- (h(r)- c) αβ- αLα(a,y)+h(r)ββ- αLβ(a,y)+H(r)- h(r)r+g(y)=(1a)≥Y- α) (f(a)- f(y))+(1a≥Y- β) (f(a)- f(y))+cαβ- αLα(a,y)+h(r)β - α(βLβ(a,y)- αLα(a,y))- R+ H(r)+g(y)=(1a)≥Y- α) (f(a)- f(y))+(1a≥Y- β) (f(a)- f(y))+h(r)β - α(βLβ(a,y)- αLα(a,y))- R+ H(r)+g(y),其中f(a)=f(a)+cβ-αa和g(y)=g(y)+cαβ-αy.现在与Fissler和Ziegel(2019a)比较,将上述符号约定中的差异模化,我们发现这一系列损失相当于Fissler和Ziegel(2019a,等式(3.2)),条件是a7→f(a)- ah(r)/(β)- α) 严格递增等于f(a)=f(a)- ac/(β)- α) 不减损。还记得h:R吗→ (0,c);在不丧失普遍性的情况下,我们可以假定c是上下限。B·4。变量的复杂性为了建立推论4和5,我们将展示三种陈述:(1){Var(k)τ,u(k)τ}∈ I和{Var(k)τ,u(k)τ}∈ cstrong当Y有界时,(2)条件1适用于u(k)τ和somer∈ Rk和(3)至少有两个分布p,p∈ P,其中u(k)τ(P)=u(k)τ(P)=r butVar(k)τ(P)6=Var(k)τ(P)。根据假设,报表2和3只需要证明P=Gmix的具体情况。这两个推论都来自命题3。报表1。回想一下,我们定义了L(x,y)=ky- xk(肯塔基州)- xk+hτ,y- xi)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 10:30:00
Herrmann等人(2018年,定理4.1,4.3)证明了L是可微且严格凸的,由此我们得出V(x,y)=xL(x,y)是u(k)τ的识别函数;参见命题2的证明。因此,通过推论7的证明,我们有{u(k)τ,Var(k)τ}∈ I.为了显示强凸性,设∧τ(v)=kvk(kvk+hτ,vi),这样我们就得到了L(x,y)=∧τ(y)-x) =ky- xk(肯塔基州)- xk+hτ,y- 十一);我们将证明∧τ是强凸的。在接下来的内容中,我们去掉范数中的下标,写出k·k=k·k。Herrmann等人(2018年,定理4.3)给出的∧τ严格凸的证明是通过显示D(v,w)=∧τ(v)+∧τ(w)进行的- ∧τ(v+w)是严格正的。这是通过扩展4·D,4D(v,w)=kv来实现的- wk+2kvk hτ,vi+2kwk hτ,wi- kv+wk hτ,v+wi,(16)并显示D(v,w)≥ 0时kτk≤ 1,如果kτk<1,则v 6=w的不等式(Herrmann等人,2018,定理4.2)。凸性如下∧τ是连续的。根据标准结果(Urruty&Lemar\'echal,2001年,命题B.1.1.2),∧τ的强凸性随后将显示D(v,w)≥ ckv- 对于一些c.检查等式(16),我们看到除了kv之外的所有项- wkterm在τ中是线性的。因此,将等式(16)中的τ替换为τ/kτk,stillsatis Herrmann等人(2018年,定理4.2)给出了0≤千伏- wk+2kvk hτ/kτk,vi+2kwk hτ/kτk,wi- kv+wk hτ/kτk,v+wi=kτkkτkkv- wk+2kvk hτ,vi+2kwk hτ,wi- kv+wk hτ,v+wi=kτkD(v,w)- (1 - kτk)kv- 工作.24 R.Frongillo和I.A.KashThus,让c=1- kτk>0,我们有∧τ的强凸性。我们得出结论,L是强Lyconvex。当Y R是有界的,命题7给出{u(k)τ,Var(k)τ}∈ 这是我想要的。报表2。我们将证明包含单变量情况的多变量情况。屋顶将利用支撑函数和Hausdor ff度量;我们现在回顾必要的定义和标准结果。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 10:30:03
支持功能hK:Sk-1.→ R∪ {∞} 一组K hK给出的RKIS(v)=supx∈Khv,xi。两个闭集A,B之间的Hausdor ff距离dH(A,B)Rk由dH(A,B)=max{supx定义∈广告(x,B),supx∈Bd(x,A)},其中d(x,S)=miny∈天-xk是点x之间的距离∈ 还有一套 Rk。我们有以下事实。1.对于所有紧凸A,B Rk,maxv∈Sk-1 |公顷(v)- hB(v)|=dH(A,B)。对于所有紧凑型A、B Rk,dH(convA,convB)≤ dH(A,B)。尽管如此 Rk,我们有0∈ INTA<==> 五、∈ Sk-1dA(v)>0。第一和第三个事实可以在Urruty&Lemar’echal(2001年,定理C.3.3.6和定理EMC.2.2.3(iii))中找到。第二种方法是取元素ai的凸组合x=Piλiaiof∈ A、 并通过元素bi来近似dH(A,B)中的每个aid∈ B.为了显示语句2,我们必须建立0∈ int{Ep[V(x,Y)]:p∈ Gmix} 对于某些识别函数V和某些x∈ Rk。我们将V作为语句1中的识别函数,x=0。任何p∈ Gmix,我们有Ep[V(0,Y)]=Ep2Y+YkY-khτ,yi+kY-kτ. (17) 让f:P7→ EpV(0,Y)。因此,必须显示0∈ intφ(Gmix)。让Sk-1={x∈ Rk:kxk=1}是单位球面,定义为z:Sk-1.→ Rkby z:u7→ 2u+hτ,uiu+τ,这是当p充分集中在u周围时φ(p)的值。设Z=Z(Sk)-1) ={z(x):x∈ Sk-1} C=convZ。对所有人来说∈ Sk-1.我们有HC(v)≥ hv,z(v)i=2hv,vi+hτ,vi-hv,vi+hv,τi=2+2hτ,vi≥ 2(1 - kτk)>0。允许 = 1.- kτk>0。Z是紧的,作为紧集的连续图像,因此存在一个有限子集Z Z与dH(Z,Z)<. 通过对Z的定义,我们可以为某些特定的元素写Z=Z(S) Sk-1.引理9∈ Swe有一些σ(u)>0,使得kφ(N(u,σ(u)I))- z(u)k<,其中N是多元高斯分布。现在取σ=minu∈Sσ(u)和定义P={N(u,σI):u∈ S} Z=φ(P)。因此我们有dH(Z,Z)<.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 10:30:07
让C=convZ,我们有(C,C)≤ dH(Z,Z)≤ dH(Z,Z)+dH(Z,Z)<2 .因此,对于所有v∈ Sk-我们有hC(v)>hC(v)- 2. > 2. - 2. = 0,给0∈ int C.当gmix是凸的,f是线性的,P Gmix,我们有C=convφ(P)=φ(convP) φ(Gmix)。我们得出结论0∈ intφ(Gmix),根据需要。引理9。无论如何∈ Sk-1.我们有limσ→0+EN(u,σI)[V(0,Y)]=z(u)。证据展开式(17),我们有Ep[V(0,Y)]=2Ep[Y]+Ephτ,Y,Y+ Ep[kY k]τ。(18) 统计性质的引出复杂性∈ Sk-设{σn}n∈Nbe收敛到零的正实数序列。定义Y(n)~N(u,σnI)。因此我们有Y(n)→ 概率微乎其微。固定坐标j∈ {1,…,k},设fj(y)=hτ,yiyjkyk和g(y)=kyk,定义X(n)=fj(y(n))和Z(n)=g(y(n))。由于Fjan和g都是reals的连续函数,因此我们有X(n)→ fj(u)和Z(n)→ g(u)=1的概率。X(n)的一致可积性来自|X(n)|≤ |Y(n)j | kτk<|Y(n)j |,并呼吁Y(n)j的一致可积性~ N(uj,σN)。对于Z(n)的一致可积性,观察kY(n)k具有非中心χ分布,因此E|Z(n)|=EkY(n)k=kσn+kuk≤kσ+1;统一可积性现在由Billingsley(2008,等式(25.13))得出。因此我们有[τ、 Y(n)Y(n)kY(n)k]=E[X(n)]→ fj(u)=hτ,uiujand E[kY(n)k]=E[Z(n)]→ g(u)=1(比林斯利,2008,定理25.12)。我们得出limσ→0+EN(u,σI)[V(0,Y)]j=2uj+fj(u)+g(u)τj=z(u)j。报表3。我们首先说明直觉的单变量情况。让p∈ μτ(p)=0且Varτ(p)>0的GMIX。后者由非零方差表示。让X~ p、 λ>0,我们有[|10]≥λX- τ |(0 - λX)]=λE[|10≥十、- τ |(0 - 十) ]=0,表示μτ(pλ)=0,其中pλ是λX的定律;注pλ∈ Gmix。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 10:30:11
然而,当λ6=1:Varτ(pλ)=E时,方差变化|10≥λX- τ|(λX)= λE|10≥十、- τ| X= λVarτ(p)。声明如下。多变量情况也类似。再次让p∈ GMIX满足u(k)τ(p)=0,协方差矩阵为正有限,因此意味着Var(k)τ(p)>0。让X~ p和λ>0。设pλ是λX的定律,并注意pλ∈ Gmix。我们现在有u(k)τ(pλ)=argminx∈RkE[kλX- xk(kλX)- xk+hτ,λX- xi)]=argminx∈RkE[kX- x/λk(kX- x/λk+hτ,x- x/λi)]=argminx∈RkE[kX- xk(kX- xk+hτ,X- xi)]=u(k)τ(p)=0。关于方差,我们同样有var(k)τ(pλ)=minx∈RkE[kλX- xk(kλX)- xk+hτ,λX- xi)=minx∈RkλE[kX- x/λk(kX- x/λk+hτ,x- x/λi)]=λVar(k)τ(p),每当λ6=1时,它再次给出不同的值。C.第4C·1节中省略的材料。引理1的识别下界。我们将简单地应用引理10,V=span P,C=P,S=Γr→ Rk由f(q)=V(r,q)给出,其中我们将q解释为符号度量。根据条件1,我们有0∈ int f(P)。现在考虑一些^V:^R×Y→ R`识别^Γ,其中^R=^Γ(P)和`∈ N、 这样,我们就可以重新定义。这意味着对于任何p∈ Γr,有一些^r∈^R使p∈^Γ^r Γr.对于任何此类^r,我们可以定义^f:span P→ R`by^f(q)=^V(^R,q)。26 R.弗隆吉洛和I.A.卡什对于任何p∈ 因此,我们有一个线性的f:span P→ 这样p∈ P∩ 克尔夫 Γr.引理10的条件现在是满足的,给予`≥ k、 因此我(Γ)≥ K引理10。设V为实向量空间。让f:V→ RK应该是线性的和C V凸,C=V,假设为0∈ int f(C)。设S=C∩ 克夫。如果`∈ N是这样的,对于所有v∈ S、 存在线性^f:V→ 带v的R\'∈ C∩ 克尔夫 S、 然后`≥ k、 证据。条件0∈ int f(C)等价于某些v。vk+1∈ C就这样0∈ int conv{f(vi):i∈ {1,…,k+1}。让α。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 10:30:14
,αk+1>0,Pk+1i=1αi=1,如果(vi)=0,则Pk+1i=1α。因为这是重心坐标,所以α的选择是唯一的,这一点在后面会很重要。我们将取v=Pk+1i=1αivi,它是C的一个凸元素,因此S的一个元素为f(v)=0。让^f:V→ R与v成线性关系∈^S:=C∩ 克尔夫 让我们,βk+1∈ R、 Pk+1i=1βi=0,因此Pk+1i=1βi^f(vi)=0。我们将证明βi必须是相同的零,即{^f(vi):i∈{1,…,k+1}}是完全独立的。通过构造,v:=Pk+1i=1βivi∈ ker^f和as v∈ker^f,对于所有λ>0,我们有vλ:=v+λv=Pk+1i=1(αi+λβi)vi∈ ker^f.取λ足够小,我们得到γi:=αi+λβi>0,而Pk+1i=1γi=Pk+1i=1αi+λPk+1i=1βi=1。通过c的凸性,我们得到了vλ∈ C.现在vλ∈ C∩ 克尔夫 S=C∩ kerf,尤其是vλ∈ 因此,如果(vi)=0,则f(vλ)=Pk+1i=1γ。由于重心坐标的唯一性∈ {1,…,k+1},我们必须有γi=αi,因此βi=0,如所需。由于^f(C)包含k+1个完全独立的点,我们有`≥ 黯淡的im^f≥ k、 完成屋顶。我们对`=k的情况做了一个最后的观察。通过一个有效的独立性,集合conv{^f(vi):i∈ {1,…,k+1}}在Rk中有维数k。当0=^f(v)=Pk+1i=1αi^f(vi),且所有i的αi>0时,我们得出结论0∈ int conv{^f(vi):i∈ {1,…,k+1} int^f(C)。C·2。引理5的期望和数量证明。让`=a off dim(Γ(P)),让r∈ relintΓ(P)。那么V=span{Γ(p)- r:p∈ P} RK是一个维数为`的向量空间。设M=[v…v`]∈ Rk×`其中v,五`∈ Rkisa V的基础。现在定义V:Γ(P)×Y→ R`by V(R,y)=M+(φ(y)- r) ,其中M+是M的摩尔-彭罗斯伪逆。显然Ep[φ(Y)]=r==> V(r,p)=0,和作为Ep[φ(Y)]- R∈ 我们有M+(Ep[φ(Y)]- r) =0==> Ep[φ(Y)]- 根据伪逆M+的性质,r=0。因此我(Γ)≤ `.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 10:30:18
而且∈ relintΓ(P),我们有M+r∈R{M+R:R∈ Γ(P)}∈R{V(R,p):R∈ Γ(P)},满足条件1。引理1现在给出iden(Γ)=`。可引出性由Γ(p)=M+(Ep[φ(Y)]- r) =Ep[M+(φ(Y)- r) ]∈ R`与链接f(R)=Mr+R;Γ当然可以作为线性属性导出。引理6的证明。函数V(r,y)i=1{y≤ ri}- αIIdentifiesΓ,我们有efv(r,Y)=0<==> i F(ri)=αi<==> i ri=qαi(F)。因此,由于分位数是可引出的,elicI(Γ)≤ k、 由于条件2暗示了该V的条件1,下界直接从引理1开始。C·3。对于命题6,对于某些严格凸函数G:Rk,考虑形式为γ(p)=G(Ep[φ(Y)]的性质→R和P-可积φ:Y→ Rk。为了避免简并,我们假设集合{Ep[φ(Y)]:p∈ P} 有一个有效的维数k,它来自引理5,确保性质Γ:p7→ Ep[φ(Y)]haselicC(Γ)=k,适用于所有C饱和临床 C I.让{dGr}r∈RK可以是G的次梯度选择,损失L(r,y)=-(G(r)+dGr·(φ(y)- r) )引出Γ,而且我们还有γ(p)=-L(p);西。g、 Frongillo&Kash(2015)。我们可以很容易地检查L=(-G)o Γ. 定理4现在立即为所有临床提供elicC(L)=elicC(Γ)=k C 一、本次讨论总结如下。统计特性的启发复杂性278。让我们来看看→ Rk,k∈ N、 是P-可积的{Ep[φ(Y)]:P∈ P} =k.那么对于任何严格凸的G:Rk→ R、 γ:p7的性质→ G(Ep[φ(Y)]对于所有C满足的Clin有elicC(γ)=k C I.D.省略了第5D·1节中的材料。引理8引理11的证明(Frongillo&Kash(2014))。让G:X→ 向量空间V的某个凸子集XO的R凸,设d∈ 是G在x处的次梯度,那么对于所有x∈ 我们已经∈ Gx<==> G(x)- G(x)=d(x- x) 。引理12。让G:X→ 向量空间V的某个凸子集X的R凸。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 10:30:22
让x,x∈ x和xλ=λx+(1)- λ) 某些λ的xf∈ (0, 1). 如果存在一些d∈ Gxλ(Gx∪ Gx),然后G(xλ)<λG(x)+(1- λ) G(x)。证据通过d在xλ处的次梯度不等式,我们得到了G(x)- G(xλ)≥ d(x)- xλ),而且引理11给出了G(x)- G(xλ)>d(x- xλ)否则我们会∈ Gx。类似地,对于x,我们有G(x)- G(xλ)>d(x- xλ)。将第一个不等式的λ加到(1)中- λ) 第二个函数给出λG(x)+(1)- λ) G(x)- G(xλ)>λd(x- xλ)+(1- λ) d(x)- xλ)=λ(1)- λ) d(x)- x) +(1)- λ) λd(x)- x) =0,其中我们使用了d的线性和恒等式xλ=x+λ(x- x) 。引理8来自于下面的结果。引理13。假设损失L与Bayes风险LelicitsΓ:P→ 2R。那么对于任何p,p∈ P与Γ(P)∩ Γ(p)=, 我们有L(λp+(1)- λ) p)>λL(p)+(1- λ) L(p)表示所有λ∈ (0, 1).证据设G=-五十、 这是积极导向的评分规则S=-L.根据Frongillo&Kash(2014)的定理2,我们得到了一些子集D G的次梯度G和双射φ:Γ(P)→ D、 使得Γ(p)=Γ-1(D)∩ Gp)。换句话说,Γ是G的一系列次梯度的重新标记:每个报告值r都有一个次梯度dr=Γ(r)∈ Γ(P)和∈ 全科医生<==> R∈ Γ(p)。观察任何分布q,q∈ P、 ifΓ(q)∩ Γ(q)=, 那么对于任何一个∈ Γ(q)和dr=Γ(r),我们有dr∈ Gq\\Gq。否则,因为∈ D∩ 根据定义,我们会有∈ D∩ Gqas很好,因此r=~n-1(博士)∈ φ-1(D)∩ Gq)=Γ(q),一个矛盾。首先假设Γ(pλ)、Γ(p)和Γ(p)都是不相交集。根据上述观察,服用任何d∈ Γ(pλ)),我们有d∈ Gpλ但d/∈ 全科医生∩ 全科医生。接下来是Emma 12的结论。否则,我们就有了r∈ Γ(pλ)∩ Γ(p)在不丧失一般性的情况下,让dr=Γ(r),我们有dr∈ Gpλ∩ Gpby定义的~n。现在假设一个矛盾,G(pλ)=λG(p)+(1)- λ) G(p)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 10:30:27
通过引理11,我们得到了G(p)- G(pλ)=dr(p- pλ)=(1)-λ) λdr(pλ- p) 。求解G(p)并代入上一个方程得到(1)- λ) 乘以方程g(pλ)=dr(pλ- p) +G(p),再应用引理11,就可以得到dr∈ 全科医生。我们现在对上面的观察结果有一个矛盾,正如我们假设的Γ(p)∩ Γ(p)=. 引理8现在紧随其后;给定Γ:P→ 引理8中的R,我们简单地将引理13应用于性质Γ:P→ 2r由Γ(p)={Γ(p)}给出。如§E·5所述,P是凸的限制对我们的结果并不重要。对于非凸P,可以通过写L(P)=fR将Bayes风险L推广到P的凸壳conv P∈RL(r,p),其中当然r=Γ(p)。然后,我们可以通过添加新的报告来扩展Γ,这是Frongillo&Kash(2014)的定理2所建议的,因此Γ是非冗余和非空的28 R.Frongillo和I.A.Kashon conv P,但与它之前对P的定义一致。引理13随后照常进行,并且由于L和P在P上没有变化,结果认为L(λP+(1)- λ) p)>λL(p)+(1- λ) L(p)表示所有λ∈ (0,1)使得λp+(1- λ) p∈ P.D·2。推论7的证明我们将把引理10和下面的一起使用。引理14。设V为实向量空间。让f:V→ RK应该是线性的,C V凸,跨度C=V,设S=C∩ ker f.如果0∈ int f(C)然后span S=k f。证据因为ker f是一个子空间,S kerf,我们知道跨度S是kerf的一个子空间。应用商空间的普适性,我们得到了线性映射π:V→ V/span S和G:V/span S→ 那么f=go π. 根据假设,{0}=π(S)=π(kerf)∩ C) =π(kerf)∩π(C)=g∩ π(C)。我们将展示一个更强的语句,即kerg={0},这意味着kerf=kerπ=span S。当span C=V时,我们有spanπ(C)=V/span S。因此,对于任何x∈ V/span S我们可以写为x=Pmi=1αixif或αi∈ R和xi∈ π(C)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 10:30:30
作为0∈ int f(C)=int g(π(C)),有一个0的开球∈ B g(π(C))。每一次我∈ {1,…,m},包含g(xi)和0的线与B相交。特别是对于一些非常小的 > 0,每个i∈ {1,…,m}我们有一些易建联∈ π(C)与g(yi)=-g(xi)。线性地,g(1)+(易)xi))=0,从π(C)的凸性我们也有1+(易)十一)∈ π(C)。从ker g的观察∩ π(C)={0}我们现在有yi=-xi定义βi=(αiαi≥ 0-αi/ αi<0≥ 0和wi=(xiαi)≥ 0yiαi<0for i∈ {1,…,m},并设置βm+1=1,wm+1=0∈ π(C)。设β=Pm+1i=1βi≥ 1.尽管我∈ {1,…,m+1},作为wi,0∈ π(C),我们有wi/β∈ π(C)的凸性。因此,m+1Xi=1(βi/β)wi=βxi∈{1,…,m}:αi≥0αixi+Xi∈{1,…,m}:αi<0-αiyi+ 1 · 0=βmXi=1αixi=βx,通过凸性,我们得出x/β∈ π(C)。最后,如果g(x)=0,那么g(x/β)=0,但是作为x/β∈π(C),我们必须有x/β=0,其中x=0。作为x∈ V/span S是任意的,我们得出结论:kerg={0}。推论7的证明。对于上限,Γ∈ I(P)意味着(L,Γ)∈ I(P),好像V(a,y)识别Γ,然后V((r,a),y)=L(a,y)- r、 V(a,y)标识(L,Γ)。推论6然后giveselicI(L)≤ k+1。对于下界,定理4给出了elicI(L)≥ 如果L是Γ的连接,则k等于。对于k+1的强下界,设V和r为识别函数,并根据条件1报告,并假设L在Γr上为非常数→ R`和g来自定理4,所以^Γ是可导出和可识别的,L=go^Γ,我们希望展示`≥ k+1。根据第4条的证明,定义,而且≥ k、 现在假设`=k表示一个矛盾。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 10:30:33
通过引理10的证明,有一个分布∈ 如果p∈^Γ^r Γr,由re-nement担保,则为0∈ int{^V(^r,p):p∈ P} 。将引理14应用于函数f:span P→ Rk,q 7→ V(r,q),我们有span kerf=spanΓr。将引理14再次应用于^f:span P→ Rk,q 7→^V(^r,q),我们有span ker^f=span^Γr.Asr Γr,我们有k^f=span^Γr spanΓr=ker f。根据第一个同构定理,我们还可以使用codim ker^f=codim ker f=k,因为这些线性映射的图像覆盖了所有Rk。通过第三个同构定理,我们得出Γr=^Γr。由于假设L是统计性质29Γr=r的非常数同构复杂性,我们有分布p,p∈^Γr,其中L(p)6=L(p),这与L是:L(p)=g(^Γ(p))=g(^r)=g((p))=L(p)的链接相矛盾。D·3。cstric和cstrong的界限我们现在给出严格凸和强凸的上下界的全部细节。检查表格L*(r,a,y)=H(r)+H(r)(L(a,y)- r) 从建立主上限的式(13)中,我们可以看到,只要h相对于L的曲率不“过快”减小,损失L*((r,a),y)在(r,a)中仍然是严格凸的。提议8。让我们∈ Cstrict,Γ:P→ Rk,k∈ N、 由二次可微、严格凸、有界损失函数L导出。如果满足条件1,则∈ Γ(P),L在Γr上是非恒量的,并且存在α>0Y∈ Y、 αaL(·,y) aL(·,y)aL(·,y)>,(19)然后ElicCrict(L)=k+1。证据对于下界,命题的条件允许我们应用推论7,它给出了elicI(L)=k+1。通过命题2,我们得出ElicCrict(L)≥ k+1。对于上限,让我∈ [0,B]不丧失一般性,因此∈ [0,B]。这对(L,Γ)是有界的。取h(r)=α+B- r、 L*((r,a),y)我们从推论6中得到。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 10:30:37
(1) 是吉文比尔吗*(r,a,y)=r+(α+B- r) L(a,y)。(20) 由于L是二次可微的,我们可以证明L的严格凸性*通过检查其Hessianis阳性特征,(r,a)L*(·,y)=1.-aL(·,y)-aL(·,y)(α+B)- r)aL(·,y). (21)根据舒尔补定理,(r,a)L*(·,y)是正定义,如果有的话,只有当(α+B- r)aL(·,y)- (-aL(·,y))(1)-1(-aL(·,y))> 0,(22),条件(19)暗示为B- R≥ 0,因此(B)- r)aL(·,y) 此外,L的Lipschitz连续性和可微性意味着L的相同*. 我们现在展示了(L,Γ)∈Cstrict,给出结果。直观地说,命题8告诉我们,只要L“足够凸”,它的曲率就可以有效地设置等式(12)和(13)中h(r)系数的递减效应。当然,这个结果也给出了强凸损失L的一个界。强凸lsaties的HessianaL(·,y) uI表示某些u>0。因此,设λ为最大特征值的上确界aL(·,y)aL(·,y)>在所有a上,这是由L的有界性和Γ范围的紧性决定的,我们可以简单地取α=2λ/u,并按照命题8进行。相反,我们使用了一种差异防范技术,这也允许我们取消两次差异性假设。命题7的证明。与命题8一样,我们的条件以及推论7和命题2给出了下界。对于上限,乘以结果y∈ Y和letF(a):=L(a,Y)。我们假设,对于大约30个R.Frongillo和I.A.Kashu>0,L和F是u-强凸的。拿L*在等式中。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 10:30:41
(20) 让C=a+B,我们有*((r,a),y)- L*((s,b),y)- (s,b)L*(s,b,y)=r+(C)- r) F(a)-s- (C)- s) F(b)-(s)- F(b))(r- s) +(C)- (s)F(b)·(a)- b)=(r)- s) +(C)- r) F(a)- (C)- s) F(b)+F(b)(r)- (s)- (C)- (s)F(b)·(a)- b) =(r)- s) +(C)- r) (F(a)- F(b))- (C)- (s)F(b)·(a)- b)≥(r)- s) +(C)- r) uka- bk+(s)- r)F(b)·(a)- b)≥(r)- s) +(C)- B) uka- bk- |s- r|kF(b)kka- bk。允许max=supa∈Γ(P),y∈YkL(·,y)k是L的最大梯度大小,这是由L的有界性和Γ范围的紧性决定的。让C=(8)最大+/u+B,我们有*((r,a),y)- L*((s,b),y)- (s,b)L*((s,b),y)≥(r)- s) +(4)麦克斯·卡- bk- 麦克斯- r|ka- bk=(r)- s) +ka- bk+|R- s|- 2.马克斯卡- bk,第三项是非负的,表示L*强凸。E.补充讨论E·1。与文献中的其他定义相比,在启发复杂性的定义上出现了一些变化,分为三大类:(1)C类的不同选择,(2)允许的损失函数类型的变化,以及(3)链接函数f的不同要求。在大多数情况下,所有这些限制都可以转换为对C的限制;例如,我们对类Cstric和Cstrong的损失施加了限制,将其限制在此类损失引起的属性上。1.属性C的类别。文献中对C的选择包括连续属性(Steinwaret al.,2014)、线性属性或期望(Agarwal&Agarwal,2015)和成分本身可引出的属性(Lambert et al.,2008),这意味着∈ C、 ^Γ:P→ Rk,应具有(^Γ)ibe,可用于i=1,k、 我们的I班和C班都属于这一类。2.改变损失函数。某些类别的属性自然由损失函数的限制来定义。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-8 10:30:45
例如,为了有效优化经验风险最小化,通常会限制凸损失;关于凸可导属性类Ccvx的诱导复杂性与凸校准维度的概念密切相关(Ramaswamy&Agarwal,2013)。CStric和CStrong类别对损失施加了进一步的限制,以便识别产生的财产。Lambert等人(2008)对属性具有可引出成分的限制也可以被转换为损失函数L是可分离的限制,这意味着L(r,y)=Pki=1L(ri,y),其中r∈ Rk。最近的另一个变化是多观测损失函数,它允许随机变量Y的多个独立实现,即形式为L(r,Y,…,ym)(Casalaina Martin等人,2017年;Frongillo等人,2019年)。多观察损失可以降低启发复杂性,有时会显著降低:与复杂性2和| Y |相比,方差和2范数对于m-观察损失都具有复杂性1,即使对于m=2- 通常设置为m=1(§3.3)。3。限制链接功能。Fissler和Ziegel(2016)提出将复杂性定义为最小k,使得Γ是k维可诱导属性的一个组成部分。等效地,链接函数必须采用简单形式f(r)=r,即r的第一个分量∈ Rk。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群