全部版块 我的主页
论坛 经济学人 二区 外文文献专区
2022-6-24 08:50:56
3a表明,延迟条件下的后悔大于非延迟条件下的后悔,3b表明,有延迟和无延迟索赔的后悔收敛速度是渐近的。通过比较图2a和图3a,我们可以看到由GP pricingalgorithm获得的累积遗憾收敛更快,产生的遗憾更小。图2b和图3b说明了两种算法实现相同收敛速度的相同结果,即1/pT log(T)。总体而言,GP pricingalgorithm优于GLM定价算法。(a) 累积后悔(b)收敛速度图3:GP算法的累积后悔和收敛速度。GP表示非延迟情况,D-GP表示延迟情况。结论与讨论我们考虑了保险背景下的动态学习和定价问题。我们的工作是首次将在线学习应用于保险。我们发现GLM和GP定价模型都具有良好的性能。将先前的工作应用于既有需求又有索赔的保险环境,我们从理论上证明了这一点,并给出了遗憾的精确界限。在数值结果中,我们发现GP定价具有更好的收敛性;然而,GLMs在保险业中的适用实施历史悠久。因此,也必须考虑此设置。更广泛地说,我们的发现表明,新的高斯过程回归可能适用于保险。然而,目前正在对其进行研究。由于保险公司无法立即观察索赔,因此在第5节中,我们将GLM定价模型算法扩展为延迟索赔。我们证明了延迟索赔的渐近遗憾界与非延迟索赔的渐近遗憾界是相同的。GP算法的结果仍然相同,但数值结果表明实现了相同的遗憾界。对于未来的调查,有几个想法。到目前为止,我们关注的是长期收入。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 08:51:00
在保险市场上,索赔可能会给保险公司造成损失甚至破产。一个想法是合并破产概率,这是用于决策的风险度量。另一个可能的想法是针对这些在线收入管理问题实施强化学习(RL)。本文考虑的Bandit问题是简单的强化学习例程。然而,可能会考虑更复杂的未来市场互动。这个问题可以建模为马尔可夫决策过程(MDP)。RL迭代地与保险模型的模拟交互,然后使用环境的反馈来选择能够最大化保险人目标的行动。虽然MDP在保险业已经应用多年,但扩展此处考虑的在线学习框架以纳入前瞻性规划是一个有待研究的领域。致谢这项工作得到了中国奖学金委员会(CSC)的资助。附录A。命题3.1的证明来自算法1、ifbβtexists和tr(P-1吨)-1.≥ L(t),我们首先将下一个价格设置为P(t+1)=pcep。如果条件(3.3)不成立,则istrPt+pcepp>cep-1.-1<L(t+1),(7.1)然后我们选择下一个价格为p=pcep+φt。我们将显示存在φt,这样trPt+pp>-1.-1.≥ L(t+1),(7.2)是令人满意的。根据Bartlett[75]中的Sherman Morrison公式,我们得到Pt+pp>-1=P-1吨-P-1tpp>P-1t1+p>p-1吨。然后,我们可以嘲笑Pt+pp>-1.= trP公司-1吨-P-1tpp>P-1t1+p>p-1tp!=tr公司P-1吨- trP公司-1tpp>P-1t1+p>p-1tp!=tr公司P-1吨-tr公司P-1tpp>P-1吨1+p>p-1tp=trP-1吨-P-1tp1+p>p-1tp≤L(t)+滴滴涕L(t).(7.3)由于t→L(t)是凸的,L(t+1)≥L(t)+滴滴涕L(t). 现在我们要证明P-1tpp>P-1吨1+p>p-1tp≥ -滴滴涕L(t)(7.4)这里,我们讨论一个一般情况。设t>n+1,设λ≥ ··· ≥ λn+1>0是pt的特征值 Rn+1和v。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 08:51:03
,vn+1be相关特征向量。由于PTI是一个对称的正定义矩阵,v,vn+1是Rn+1的正交基,我们可以确定最佳价格pcep=Pn+1i=1αIvisa这些单位特征向量的线性组合。下一个价格为p=pcep+ (vn+1,1CEP- vn+1),这里vn+1,1是vn+1的第一个组成部分。我们知道kvik=1和| vn+1,i |≤ 1代表所有i.然后我们有KP- pcepk=kvn+1,1pcep- vn+1k≤ 1+最大值∈Pkpk.它表明kφtk≤ 1+最大值∈Pkpk. (7.5)我们选择|| ≤ 1以便 ≥ 如果αn+1,则为0≤ 0 ,  < 如果αn+1>0,(7.6)和˙L(t),则为0≤ (n+1)-2.1+L(n+1)-1maxp∈Pkpk-1.(7.7)我们编写kpkP-1t=p>p-1吨。自λmaxP-1吨= λmin(Pt)-1,λmin(Pt)≥ L(t)和t>n+1,我们有1+kpkP-1吨≤ 1+λ最大值P-1吨kpk=1+λmin(Pt)-1kpk≤ 1+L(t)-1kpk≤ 1+L(n+1)-1maxp∈Pkpk。(7.8)此外,P-1tp=P-1tn+1Xi=1αivi+vn+1,1n+1Xi=1αivi!- vn+1!!=P-1tn+1Xi=1αivi+vn+1,1nXi=1αivi+αn+1vn+1!- vn+1!!=P-1t(αn+1+ (vn+1,1αn+1- 1) )vn+1+nXi=1(1+ vn+1,1)!αivi=(αn+1+ (vn+1,1αn+1- 1)) λ-1n+1vn+1+nXi=1(1+ vn+1,1)λ-1iαivi=(αn+1+ (vn+1,1αn+1- 1)) λ-1n+1kvn+1k+nXi=1(1 +  vn+1,1)λ-1iαikvik公司≥ ((1 + vn+1,1)αn+1- )λ-2n+1kvn+1k≥ λ-2n+1。(7.9)自|| ≤ 1,然后1+vn+1,1≥ 与(7.6)一起,我们可以得到第二个不等式((1+vn+1,1)αn+1- )≥ (1 + vn+1,1)αn+1+≥ .由于PTI是一个对称的正定义矩阵,我们有tr(P-1吨)-1.≤ λmin(Pt)≤ n tr(P-1吨)-根据(7.1)和Sherman-Morrison公式,我们得到λn+1≤ (n+1)tr(P-1吨)-1.≤ (n+1)trPt+pcepp>cep-1.-1<(n+1)L(t+1)。(7.10)通过(7.9)和(7.10),P-1tp≥ (n+1)-2L(t+1)-(7.11)与(7.8)和(7.11)一起,我们有KP-1tpk1+kpkP-1吨≥(n+1)-2L(t+1)-21+升(n+1)-1maxp∈Pkpk。选择 = Kq˙L(t)并且给定上述不等式的LHS,我们让κ=K(n+1)-2.1+L(n+1)-1maxp∈Pkpk-1、此处κ≥ 1 by(7.7)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 08:51:06
然后我们得到了KP-1tpk1+kpkP-1吨≥κ˙L(t)L(t+1)。由于L(t)的凸性,存在κ>1,因此κL(t)≥ L(t+1)和kp-1tpk1+kpkP-1吨≥κ˙L(t)L(t+1)≥˙L(t)L(t)。它表明条件(7.2)成立。B、 命题4.1的证明价格向量可以写成由p=p(β)给出的β函数。自p(β)∈ P和r(p*,β)最佳价格p下的pi=0*, 通过泰勒级数展开,我们可以导出| r(p,β)- r(p*, β)| ≤支持∈Pr(p,β)圆周率kp公司- p*k、 对于所有p∈ P、 设k=支持∈Pr(p,β)pi< ∞, 我们有| r(p,β)- r(p*, β)| ≤ k kp- p*k、 根据Duistermaat和Kolk[76]中隐函数定理的定义,存在一个开放且有界的邻域V,使得函数β→ p(β)与有界导数连续可微。因此,对于所有β∈ V和一些非随机常数K>0,我们有kp(β)- p(β)k≤ Kkβ- βk。假设存在bβt∈ V代表所有t,那么p(bβt)- p(β)≤ Kbβt- β.这表明遗憾的上界取决于bβt- β.C、 命题4.2的证明为了证明命题4.2,我们需要以下引理。引理7.1。设H是来自Rd的光滑连续可区分的注入→ Rd,H(x)=y。定义Bρ{x∈ Rd | kx- xk公司≤ ρ} 以及Bρ={x∈ Rd | kx- xk=ρ}。然后,infx∈Bρ(x)kH(x)-y) k级≥ δ意味着Bδ(y)={y∈ Rd | ky- yk公司≤ δ}  H(Bρ(x)),它给出H-1(Bδ(y)) Bρ(x)。证据自H:Bρ(x)7起→ H(Bρ(x))是一个同胚,我们可以根据Dugundji[77]中的定理3.1和推论3.2直接导出结果。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 08:51:10
对于任何集合B Hd+1和a同胚H:B 7→ Hd+1,如果x是B的内边界点,那么h(x)是h(B)的内边界点。这是因为根据Brouwer域不变性定理,对于任何空间B,性质“open inHd+1”是B rel Hd+1的位置不变量。它只是告诉我们∈ {y∈ Rd | ky- yk公司≤ δ} ,有一个x∈ {x∈ Rd | kx- xk公司≤ρ} 使得H(x)=y。同样,我们将β的闭合有界邻域定义为Bρ=β ∈ Rkβ- βk≤ ρ和Bρ=β ∈ Rkβ- βk=ρ.现在,我们将开始证明命题4.2,即确定E的值bβt- β.命题4.2的证明。由于β不受σ的影响,在不丧失一般性的情况下,我们假设σ=1。h(·)yieldsyi的泰勒展开- h(p(i)>β)=yi- h(p(i)>β)+h(p(i)>β)- h(p(i)>β)=yi- h(p(i)>β)-˙h(p(i)>eβ)p(i)>(β- β) ,因为有些β位于β和β之间的线段上。Thuslt(β)- lt(β)=tXi=1p(i)(h(p(i)>)β- h(p(i)>)β)=tXi=1p(i)p(i)>˙h(p(i)>eβ)(β- β) .在假设A1和A2下,Bβtin Lai和Wei的强一致性[8]成立。我们需要=tXi=1p(i)p(i)>!-1tXi=1p(i)ηi=P-1ttXi=1p(i)ηi,这里ηi:=yi- h(p(i)>β)。自E[ηi | Fi-1] =0,kEtk→ 0 a.s.写入Ht(β)=P-1tlt(β)和letκ=infβ∈Bρ,p∈P˙h(P(i)>β)>0。如果kβ- βk≤ ρ、 那么对于所有β∈ Bρ,我们有kht(β)- Ht(β)k=P-1t(lt(β)- lt(β))= (β- β) >tXi=1p(i)p(i)>˙h(p(i)>eβ)tXi=1p(i)p(i)>!-2tXi=1p(i)p(i)>˙h(p(i)>eβ)(β- β)≥ (β- β) >tXi=1p(i)p(i)>˙h(p(i)>eβ)tXi=1˙h(p(i)>eβ)κp(i)p(i)>!-2tXi=1p(i)p(i)>˙h(p(i)>eβ)(β- β) =κkβ- βk。特别是,如果kβ- βk=ρ,我们有KHT(β)- Ht(β)k≥ κρ> 0 .LeteHt(β)=Ht(β)- 当EHT(β)=0时,我们有Ehkβt- βki=OEeHt(βt). ByLemma 7.1,我们知道-1t(Et)在{β:kβ上定义良好- βk≤ ρ}. SincetXi=1p(i)h(p(i)>eH-1t(Et))- 易=tXi=1p(i)p(i)>eHt公司呃-1t(Et))- Et公司= 0,我们得到bβt=eH-1t(Et)存在,且HT(bβt)=Et。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 08:51:13
给定λmin(t)→ ∞ 作为t→ ∞ 对于所有的大t,PTI都是非奇异的,eHt(bβt)=P-1ttXi=1p(i)ηi≤P-t型P-ttXi=1p(i)ηi= λ-1min(t)tXi=1p(i)>ηi!P-1ttXi=1p(i)ηi!。定义N=inf{t:Ptis非相似}。假设N<∞ 对于t≥ N、 我们让Vt=P-1tandQt=tXi=1p(i)>ηi!VttXi=1p(i)ηi!。应用谢尔曼-莫里森公式,我们得到了Qt的递推形式。对于k>N,我们有qk=kXi=1p(i)>ηi!VkkXi=1p(i)ηi=k-1Xi=1p(i)>ηi!Vkk公司-1Xi=1p(i)ηi!+p(k)>Vkp(k)ηk+2p(k)>Vkk-1Xi=1p(i)ηi!ηk=Qk-1+k-1Xi=1p(i)>ηi!-Vk公司-1p(k)p(k)>Vk-11+p(k)>Vk-1p(k)k-1Xi=1p(i)ηi!+p(k)>Vkp(k)ηk+2p(k)>Vk-11+p(k)>Vk-1p(k)k-1Xi=1p(i)ηi!ηk=Qk-1.-p(k)>Vk-1件-1i=1p(i)ηi1+p(k)>Vk-1p(k)+p(k)>Vkp(k)ηk+2p(k)>Vk-11+p(k)>Vk-1p(k)k-1Xi=1p(i)ηi!ηk.Letγk=p(k)>Vk-1件-1i=1p(i)ηi1+p(k)>Vk-1p(k),θk=p(k)>Vkp(k)ηk,ωk-1= 2p(k)>Vk-11+p(k)>Vk-1p(k)k-1Xi=1p(i)ηi!。这里,γk,θk≥ 0和ωk-1是Fk-1-可测量。求和,t>N,Qt=QN-tXk=N+1γk+tXk=N+1θk+tXk=N+1ωk-1ηk.此处,Qt≥ 0是一个扩展的随机Liapounov函数,如果它是Ft可测的(Lai[9])。根据鞅的强大定律,对于任何α>0,我们有Maxqt,tXk=N+1γk!=OtXk=N+1θk+tXk=N+1ωk-1!+α.局部鞅收敛定理和强大数定律(Chow[78])表明ptk=N+1ωk-1.≤ 4Ptk=N+1γk。当极限→∞λmax(t)=∞, 根据Kronecker引理和Freeman定理[79],我们得到了txk=N+1θk=OtXk=N+1p(k)>Vkp(k)!=O(对数λmax(t))。它意味着当限制→∞λmax(t)=∞, 我们有qt=O(logλmax(t))和txk=N+1γk=O(logλmax(t))。假设假设A1和A2成立,根据Lai和Wei[8]中的定理2,我们得到Bβ与bβt- β= O对数λmax(t)λmin(t)= O对数(t)λmin(t).假设λmin(t)≥ L(t)保持,我们有bβt- β= O对数(t)L(t).D、 定理4.2的证明在本节中,我们给出了定理4.2的证明所用的引理。这一证明基于Srinivas等人的研究。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 08:51:17
[13]. 我们首先给出了[13]的以下结果。引理7.2。[13,引理5.3]如果fT=(f(pt))∈ RT,GP中的信息增益可表示为asI(yT;fT)=TXt=1log1 + σ-2σt-1(pt).这里,σ是高斯噪声的方差,σt-1(pt)是t之后的后验方差-1观察结果。证据香农互信息I定义为asI(yT;fT)=H(yT)- H(yT | f)。(7.12)它量化了关于ffrom揭示y的不确定度的减少(根据不同的香农熵测量)。通过定义H(·),我们得到了高斯过程的H(yT | f)=log | 2πeσI |=TXt=1log(2πeσ)。(7.13)我们可以展开H(yT)asH(yT)=H(yT-1) +H(yT | yT-1) =H(yT-1) +对数(2πe(σ+σt-1(pt)))。通过展开熵项,我们得到h(yT)=TXt=1log(2πe(σ+σt-1(pt)))。(7.14)将(7.13)和(7.14)代入(7.12),我们可以得到结果。以下引理用于获得γT上的有限界。证明相当复杂,读者可以阅读Srinivas等人[13]中的定理8。引理7.3。[13,定理8]假设假设4.1成立。选择nT=cTτlog T,其中c为常数,τ>0。对于任何T*∈ {1,…,min(T,nT)},我们让Bk(T*) =Ps>T*λs,这里λ是核k(p,p)的奇异值w.r.t,p上的均匀分布,然后γt上的界由γt给出≤1/21 - e-1最大值∈{1,…,T}(T*对数(rnT/σ)+cσ(1- r/T)(对数T)(Tt+1Bk(T*) + 1) )+O(T1-电话/日期)。在证明定理4.2之前,我们还需要建立以下引理。引理7.4提供了有限决策集| P |<∞, 选择所有决策的地方。引理7.5显示了一组离散化的置信区间 P其中P RDI是一般紧集。表示πt>0的序列,使ptπ-1t=1。引理7.4。拾取δ∈ (0,1)并设置Дt=2 log(| P |πt/δ)。然后概率大于1- δ、 对于任何p∈ P和t≥ 1、我们有r(p)- urt-1(p)≤√νtσrt-1(pt)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 08:51:21
(7.15)此处σrt-1(p)=pt-1σdt-1(p)+σct-1(p)。证据以yt为条件-1=(y,…,yt-1) ,{p,…,pt-1} 是确定性的,边缘跟随F(p)~ N(ut-1(p),σt-1(p))对于任何固定的≥ 1和p∈ P通过下面的尾界,我们知道(z>c)≤ (1/2)e-c/2如果z,c>0~ N(0,1)。设z=(f(p)- ut-1(p))/σt-1(p)和c=Д1/2t,则p|f(p)- ut-1(p)|σt-1(p)>1/2吨≤ e-^1t/2。概率大于1- |P | e-^1t/2,我们有| f(p)- ut-1(p)|≤ ^11/2tσt-1(p)。给定r(p)=p·fd(p)- fc(p),概率大于1- |P | e-^1t/2,我们有r(p)- urt-1(p)=(pfd(p)- fc(p))-pud- uc≤pfd(p)- pud+ |(fc(p)- uc)|≤ pД1/2tσdt-1(p)+Д1/2tσct-1(p)。Letσrt-1(p)=pt-1σdt-1(p)+σct-1(p)并选择| p | e-νt/2=δ/πt。通过所有t上的并集,我们得到了结果。根据假设4.1和并集界限,我们有P支持∈P|f级/pj |>J≤ ae-(日本)。因此,存在c>0,对于a,b>0,这样P支持∈Prpj公司> J≤ ae-(日本)。然后概率大于1- ae-(J/b),适用于所有p∈ P、 我们有r(P)- r(p)|≤ J kp公司- 主键。(7.16)现在,考虑满足kp的基数ζt的离散化序列- [p] tk公司≤ r/ζt,(7.17),其中r=ph-物价指数是一个常数,它是价格集的长度,[p]是最接近于Pt中p的价格。设δ/2=ae-(J/b)并应用(7.16)。概率大于1- δ/2,| r(p)- r(p)|≤ bplog(2a/δ)kp- 主键。与(7.17)一起,我们可以得出| r(p)- r([p]t)|≤ bplog(2a/δ)kp- [p] tk公司≤ rbplog(2a/δ)/ζt。选择ζt=tyields | r(p)- r([p]t)|≤ rbplog(2a/δ)/t。我们现在可以推导遗憾的界限。引理7.5。拾取δ∈ (0,1)并设置Дt=2 log(2πtt/3δ)+2 logt型.然后概率大于1- δ/2,对于任何p∈ P和t≥ 1、我们有r(p)- urt-1(【p】t)≤ ^11/2tσrt-1([p]t)+rbplog(2a/δ)t.(7.18)证明。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 08:51:24
与(7.17)一起,我们可以得出| r(p)- r([p]t)|≤ bplog(2a/δ)kp- [p] tk公司≤ rbplog(2a/δ)/ζt.By引理7.4,对于所有p∈ 概率大于1的P- δ/2,r(p)- urt-1(【p】t)≤ |r(p)- r([p]t)|+r(【p】t)- urt-1(【p】t)≤ rbplog(2a/δ)/t+Д1/2tσrt-1例([p]t)。然后得到结果。引理7.6。概率大于1- δ、 对于所有t≥ 1,遗憾以r(p)为界*) - r(pt)≤ 2.√νtσrt-1(pt)+rbplog(2a/δ)t.证明。根据pt=arg maxp的定义∈Purt-1(p)+√νtσrt-1(p),我们有urt-1(pt)+√νtσrt-1(pt)≥ urt-1([p*]t)+√νtσrt-1([p*]t) 。(7.19)到(7.18),我们有urt-1([p*]t)+√νtσrt-1([p*]t)≥ r(p*) - rbplog(2a/δ)/t.(7.20)(7.19)和(7.20)表示urt-1(pt)+√νtσrt-1(pt)≥ r(p*) - rbplog(2a/δ)/t。与(7.15)一起,我们可以得出(p*) - r(pt)≤ urt-1(pt)+√νtσrt-1(pt)+rbplog(2a/δ)t- r(pt)≤ 2.√νtσrt-1(pt)+rbplog(2a/δ)t.Lemma 7.7。对于加性核kd(p,p)+kc(p,p)的组合,我们有γT(kd+kc)≤ γT(kd)+γT(kc)。证据对于 P、 设kd为kd(P,P)的A上的Gram矩阵,Kcbe为kc(P,P)的Gram矩阵。我们可以显示日志I+σ-2(Kd+Kc)≤ 日志I+σ-2Kd+ 日志I+σ-2Kc.它给出了γT(kd+kc)≤ γT(kd)+γT(kc)。E、 定理5.1的证明为了证明定理5.1,我们需要以下引理。引理7.8。PTs=1eτs=PTt=1τt.证明。根据eτs的定义,我们得到TXs=1eτs=TXs=1(s- 1.- N(ρ(s))=TXt=1(t- 1) -TXs=1N(ρ(s))=TXt=1(t- 1) -TXt=1N(t)=TXt=1(t- 1.- N(t))=TXt=1τt。第三个等式是因为{ρ(s):s=1,…,t}是{1,…,t}的置换。质量的四分之一由N(t)=Pt的定义得出-1i=1{i+τi≤ t型- 1}.引理7.9。给定最大等待时间m和τt≤ 对于所有t,我们有eτs≤ 所有s.Proof均为2m。根据eτs的定义,我们得到eτs=s- 1.- N(ρ(s))≤ s- 1.- (ρ(s)- 1.- m)≤ τρ(s)+m≤ 2米。在第一个不等式中,我们使用N(ρ(s))≥ ρ(s)-1.-m。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 08:51:27
这是因为在时间ρ(s)的开始处,至少有ρ(s)-1.-m,最大ρ(s)-1可以观察到索赔。在第二个不等式中,我们假设当在时间ρ(s)选择价格,然后在时间ρ(s)+τρ(s)观察价格时,会产生第s个索赔。时间ρ(s)+τρ(s)观察到的索赔数量-1是N(ρ(s)+τρ(s))。那么,在时间ρ(s)+τρ(s)中观察到的第一个主张是N(ρ(s)+τρ(s))+1,这也是第s个主张。这意味着s=N(ρ(s)+τρ(s))+1≤ ρ(s)+τρ(s)。自τt≤ m对于所有t,我们得到eτs≤ 2米。参考文献[1]R.L.Phillips,《定价和收入优化》,斯坦福商业图书,加利福尼亚州斯坦福市,2005年。[2] K.Talluri,G.van Ryzin,《收入管理理论与实践》,马萨诸塞州波士顿斯普林格,2005年。统一资源定位地址https://doi.org/10.1007/b139000[3] J.A.Nelder,R.W.M.Wedderburn,《广义线性模型》,皇家统计学会杂志135(3)(1972)370–384。内政部:10.2307/2344614。统一资源定位地址http://www.jstor.org/stable/2344614[4] P.McCullagh,J.A.Nelder,《广义线性模型》,第二版,查普曼和霍尔,伦敦,1989年。统一资源定位地址http://www.utstat.toronto.edu/~brunner/oldclass/2201s11/readings/glmbook。pdf【5】T.L.Lai,H.Robbins,《自适应设计与随机近似》,统计年鉴7(6)(1979)1196-1221。内政部:10.1214/aos/1176344840。[6] T.Lai,H.Robbins,《随机近似格式中斜率估计的相合性和渐近有效性》,Z.Wahrscheinlichkeittheorie verw。Gebiete 56(3)(1981)329–360。统一资源定位地址https://doi.org/10.1007/BF00536178[7] T.Lai,H.Robbins,《多周期控制中的迭代最小二乘法》,应用数学进展3(1)(1982)50–73。统一资源定位地址https://doi.org/10.1016/S0196-8858(82)80005-5[8]T.L.Lai,C.Z。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 08:51:30
Wei,《随机回归模型中的最小二乘估计及其在动态系统识别和控制中的应用》,《统计年鉴》10(1)(1982)154–166。内政部:10.1214/aos/1176345697。[9] T.Lai,《随机近似:特邀论文》,《统计年鉴》31(2)(2003)391–406。内政部:10.1214/aos/1051027873。[10] A.Den Boer,B.Zwart,《使用受控方差定价同时学习和优化》,管理科学60(3)(2013)770–783。统一资源定位地址https://doi.org/10.1287/mnsc.2013.1788[11] J.Moˇckus,《贝叶斯全局优化方法,数学及其应用》,荷兰斯普林格,1989年。内政部:10.1007/978-94-009-0909-0。[12] J.Moˇckus,《贝叶斯全局优化方法及其在多目标和约束问题中的应用》,《全局优化杂志》4(4)(1994)347–365。内政部:10.1007/BF01099263。[13] N.Srinivas,A.Krause,S.M.Kakade,M.Seeger,《班迪特环境下的高斯过程优化:无遗憾和实验设计》,CoRRdoi:10.1109/TIT。2011.2182033.统一资源定位地址http://arxiv.org/abs/0912.3995[14] N.Srinivas,A.Krause,S.M.Kakade,M.Seeger,《bandit环境下高斯过程优化的信息论遗憾界限》,IEEE信息论交易58(5)(2012)389–434。内政部:10.1109/TIT。2011.2182033.统一资源定位地址https://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=6138914[15] C.E.Rasmussen,C.K.I.Williams,《机器学习的高斯过程,自适应计算和机器学习》,麻省理工学院出版社,马萨诸塞州剑桥,2006年。[16] E.Brochu,V.M.Cora,N。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 08:51:33
de Freitas,关于昂贵代价函数的贝叶斯优化的教程,应用于主动用户建模和分层强化学习,CoRRabs/1012.2599。统一资源定位地址http://arxiv.org/abs/1012.2599[17] SwissRe,《数字时代的人寿保险:未来的根本变革》,瑞士再保险SigmaReport。统一资源定位地址http://www.biztositasiszemle.hu/files/201512/sigma6_2015_en.pdf[18] H.B–uhlmann,《风险理论中的数学方法》,Grundlehren der mathematischen Wissenschaften,Springer Verlag Berlin-Heidelberg,2005年。内政部:10.1007/978-3-540-30711-2。[19] C.McClenahan,《费率制定》,第4版,意外保险精算学会,1984年,第3章,第75-148页。[20] P.de Jong,G.Z.Heller,《保险数据的广义线性模型》,剑桥大学出版社,2008年。统一资源定位地址https://feb.kuleuven.be/public/u0017833/boek.pdf[21]L.A.Baxter、S.M.Coutts、G.A.F.Ross,《线性模型在汽车保险中的应用》,载于:第21届国际精算师大会,第2卷,Elsevier,1980年,第11-29页。【22】S.M.Coutts,《汽车保险评级,精算方法》,精算师协会杂志111(1)(1984)87–148。统一资源定位地址https://www.jstor.org/stable/41140673【23】R.A.Bailey,L.J.Simon,《汽车保险费率制定的两项研究》,ASTIN公告:国际精算协会杂志1(4)(1960)192–217。内政部:10.1017/S051503610009569。[24]M.David,《使用广义线性模型计算汽车保险费》,Promedia Economics and Finance 20(2015)147–156。内政部:10.1016/S2212-5671(15)00059-3。[25]E.Ohlsson,J.B.,《广义线性模型的非寿险定价》,施普林格,柏林,海德堡,2010年。统一资源定位地址https://link.springer.com/book/10.1007/978-3-642-10791-7【26】S.Haberman,A.E.Renshaw,《广义线性模型与精算学》,皇家统计学会杂志45(4)(1996)407–436。内政部:10.2307/2988543。【27】R.Kaas,M。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 08:51:36
Goovaerts,J.Dhaene,M.Denuit,《现代精算风险理论:使用R》,第二版,柏林斯普林格,2009年。内政部:10.1007/978-3-540-70998-5。[28]E.W.Frees,《精算和金融应用回归建模》,国际实际科学系列,剑桥大学出版社,剑桥,2010年。【29】M.V.W¨uthrich,C.Buser,《非寿险定价的数据分析》,瑞士金融研究所研究论文16-68号。统一资源定位地址https://ssrn.com/abstract=2870308【30】G.C.Evans,《垄断的动态》,《美国数学月刊》31(2)(1924)77–83。内政部:10.2307/2300113。统一资源定位地址http://www.jstor.org/stable/2300113【31】G.C.Evans,《经济学数学导论》,麦格劳·希尔,纽约,1930年。统一资源定位地址http://hdl.handle.net/2027/uc1.b3427705[32]E.A.Greenleaf,《参考价格效应对价格促销可行性的影响》,营销科学14(1)(1995)82–104。内政部:10.1287/mksc。14.1.82.统一资源定位地址https://pubsonline.informs.org/doi/pdf/10.1287/mksc.14.1.82【33】P.Kopalle,A.Rao,J.Assuncao,《不对称参考价格效应和动态定价政策》,营销科学15(1)(1996)60–85。统一资源定位地址http://www.jstor.org/stable/184184【34】G.Fibich,A.《具有非光滑(不对称)参考价格效应的优化模型和差异博弈的显式解》,运筹学51(5)(2003)721–734。统一资源定位地址http://www.jstor.org/stable/4132433【35】Y.Aviv,G.Vulcano,《动态列表定价》,摘自《牛津定价管理手册》,牛津大学出版社,2012年,第23章,第522-58页。内政部:10.1093/oxfordhb/9780199543175.013.0023。【36】A.Den Boer,《动态定价和学习:历史起源、当前研究和新方向》,《运筹学和管理科学调查》20(1)(2015)1-18。内政部:10.1016/j.sorms。2015.03.001.【37】M.V。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 08:51:39
W–uthrich,《非人寿保险:数学与统计》(2017)。统一资源定位地址http://dx.doi.org/10.2139/ssrn.2319328【38】R.W.M.Wedderburn,《拟似然函数、广义线性模型和高斯-牛顿方法》,生物计量学61(3)(1974)439–447。内政部:10.2307/2334725。[39]T.W.Anderson,J.B.Taylor,《正态线性回归中最小二乘估计的强一致性》,《统计年鉴》4(4)(1976)788–790。内政部:10.1214/aos/1176343552。[40]黎泰林,H.罗宾斯,魏志忠,多元回归中最小二乘估计的强一致性,美国国家科学院院刊75(7)(1978)343-361。内政部:10.1016/0047-259X(79)90093-9。[41]K.Chen,I.Hu,Z.Ying,具有固定和自适应设计的广义线性模型中最大拟似然估计的强相合性,统计年鉴27(4)(1999)1155–1163。内政部:10.1214/aos/1017938919。【42】S.Bubeck,N.Cesa Bianchi,《随机和非随机多武装匪徒问题的遗憾分析,机器学习的基础和趋势》5(1)(2012)1-122。内政部:10.1561/2200000024。统一资源定位地址http://sbubeck.com/SurveyBCB12.pdf【43】P.Auer,N.Cesa Bianchi,P.Fischer,《多武装匪徒问题的有限时间分析》,机器学习47(2-3)(2002)235–256。内政部:10.1023/A:1013689704352。[44]T.Lai,H.Robbins,《渐近有效自适应分配规则》,应用数学进展6(1)(1985)4-22。统一资源定位地址http://dx.doi.org/10.1016/0196-8858(85)90002-8【45】V.Dani,T.P.Hayes,S.M.Kakade,《班迪特反馈下的随机线性优化》,摘自:21世纪学习理论年会(COLT),2008年,第355-366页。统一资源定位地址http://colt2008.cs.helsinki.fi/papers/80-Dani.pdf【46】P.Rusmevichienton,J.N。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 08:51:42
Tsitsiklis,《线性参数化bandits》,《作战数学研究》35(2)(2010)395–411。统一资源定位地址https://pubsonline.informs.org/doi/pdf/10.1287/moor.1100.0446【47】S.Filippi,O.Cappe,A.Garivier,C.Szepesv'ari,《参数匪徒:广义线性案例》,in:神经信息处理系统的进展23(NIPS 2010),2010,第586–594页。统一资源定位地址https://sites.ualberta.ca/~szepesva/papers/GenLinBandits-NIPS2010。pdf【48】S.Bubeck,R.Munos,G.Stoltz,N.Cesa Bianchi,《X-武装匪徒》,机器学习研究杂志12(2011)1655–1695。统一资源定位地址http://www.jmlr.org/papers/volume12/bubeck11a/bubeck11a.pdf【49】R.Kleinberg,A.Slivkins,E.Upfal,《公制空间中的多臂强盗》,摘自:第四十届ACM年度计算理论研讨会论文集,ACM,2008年,第681-690页。内政部:10.1145/1374376.1374475。统一资源定位地址http://doi.acm.org/10.1145/1374376.1374475【50】S.Agrawal,N.Goyal,《多武装匪徒问题的汤普森抽样分析》,载于:25年度学习理论会议,第23卷,2012年,第39.1-39.26页。统一资源定位地址http://proceedings.mlr.press/v23/agrawal12/agrawal12.pdf【51】S.Agrawal,N.Goyal,《汤普森抽样的进一步最佳后悔界限》,载于:第16届国际艺术情报与统计会议(AISTATS),第31卷,2013年,第90-107页。统一资源定位地址http://proceedings.mlr.press/v31/agrawal13a.pdf【52】D.Russo,B.Van Roy,《通过后验抽样学习优化》,《运营数学研究》39(4)(2013)1221–1243。统一资源定位地址https://pubsonline.informs.org/doi/pdf/10.1287/moor.2014.0650【53】J.Moˇckus,V.Tiesis,A.Zilinskas,《寻找极值的贝叶斯方法》,载于:TowardsGlobal Optimization,第2版,第2卷,Elsevier Science Ltd,North Holland,Amsterdam,1978年,第117-129页。【54】J.Snoek,H.Larochelle,R.P.Adams,《机器学习算法的实用贝叶斯优化》,载于:F.Pereira,C.J.C.Burges,L。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 08:51:45
Bottou,K.Q.Weinberger(编辑),《神经信息处理系统的进展》,25,Curran Associates,Inc.,2012年,第2951-2959页。统一资源定位地址http://papers.nips.cc/paper/4522-practical-bayesian-optimization【55】G.Gallego,G.Van Ryzin,《单位区域随机需求下库存的最优动态定价》,管理科学40(8)(1994)999–1020。统一资源定位地址http://www.jstor.org.manchester.idm.oclc.org/stable/2633090【56】Y.Aviv,A.Pazgal,《动态定价的部分观察马尔可夫决策过程》,管理科学51(9)(2005)1400–1416。统一资源定位地址http://www.jstor.org.manchester.idm.oclc.org/stable/20110429【57】J.Harrison,N.Keskin,A.Zeevi,《贝叶斯动态定价政策:无偏先验分布下的学习和收益》,《管理科学》58(3)(2012)570–586。统一资源定位地址https://doi.org/10.1287/mnsc.1110.1426【58】J.Broder,P.Rusmevichienton,《一般参数选择模型下的动态定价》,运筹学60(4)(2012)965–980。统一资源定位地址http://search.proquest.com/docview/1041256005/【59】R.Kleinberg,T.Leighton,《了解需求曲线的价值:在线公布价格拍卖的后悔界限》,摘自:第44届IEEE计算机科学基础研讨会论文集,IEEE,美国,2003年,第594-605页。内政部:10.1109/SFCS。2003.1238232.[60]E.Cope,《电子商务动态定价的贝叶斯策略》,海军研究后勤(NRL)54(3)(2007)265–281。内政部:10.1002/nav。20204。[61]P.Rusmevichienton,B.Van Roy,P.W.Glynn,《多产品定价的非参数方法》,运筹学54(1)(2006)82–98。内政部:10.1287/opre。1050.0252.【62】O.Besbes,A.Zeevi,《不知道需求函数的动态定价:风险边界和近似最优算法》,运筹学57(6)(2009)1407–1420。统一资源定位地址http://www.jstor.org/stable/25614853【63】O.Besbes,A。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 08:51:48
Zeevi,《盲网络收入管理》,运筹学60(6)(2012)1537–1550。统一资源定位地址https://pubsonline.informs.org/doi/pdf/10.1287/opre.1120.1103【64】M.Dudik,D.J.Hsu,S.Kale,N.Karampatziakis,J.Langford,L.Reyzin,T.Zhangn,情境匪徒的科学临时学习,摘自:第27届不确定性国际情报会议记录,2011年,第1-20页。统一资源定位地址http://www.cs.columbia.edu/~djhsu/papers/amo。pdf【65】O.Chapelle,L.Li,《汤普森抽样的经验评估》,摘自:J.Shawe Taylor,R.S.Zemel,P.L.Bartlett,F.Pereira,K.Q.Weinberger(编辑),《神经信息处理系统的进展》,24,Curran Associates,Inc.,2012年,第2249–2257页。统一资源定位地址https://www.microsoft.com/en-us/research/wp-content/uploads/2016/02/thompson.pdf【66】N.Cesa Bianchi,C.Gentile,Y.Mansour,A.Minora,《非暴力强盗中的延迟与合作》,机器学习研究杂志20(17)(2016)1-38。统一资源定位地址http://www.jmlr.org/papers/volume20/17-631/17-631.pdf【67】C.Pike Burke、S.Agrawal、C.Szepesvari、S.Grunewalder,《具有延迟、聚合匿名反馈的强盗》,收录于:《机器学习学报》(ICML),第802018卷,第4105-4113页。统一资源定位地址http://proceedings.mlr.press/v80/pike-burke18a/pike-burke18a.pdf[68]A.Agarwal,J.C.Duchi,分布式延迟随机优化,载于:第24届国际神经信息处理系统会议记录,NIPS\'11,Curran Associates Inc.,美国,2011年,第2312-2320页。统一资源定位地址https://papers.nips.cc/paper/4247-distributed-delayed-stochastic-optimization【69】T.Desautels,A.Krause,J.W.Burdick,《高斯过程bandit优化中的并行勘探开发交易》,机器学习研究杂志15(2014)4053–4103。统一资源定位地址http://jmlr.org/papers/volume15/desautels14a/desautels14a.pdf[70]C.Vernade,O.Capp\'e,V。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 08:51:51
Perchet,延迟转换的随机bandit模型,arXiv预印本/1706.09186。arXiv:1706.09186。统一资源定位地址http://arxiv.org/abs/1706.09186【71】P.Joulani,A.Gy¨orgy,C.Szepesv'ari,《延迟反馈下的在线学习》,载于:《第30届机器学习国际会议记录》(ICML),美国佐治亚州亚特兰大,2013年,第1453-1461页。统一资源定位地址http://proceedings.mlr.press/v28/joulani13.pdf[72]T.W.Anderson,J.B.Taylor,《动态模型中最小二乘估计的强一致性》,《统计年鉴》7(3)(1979)484–489。内政部:10.1214/aos/1176344670。【73】N.B.Keskin,A.Zeevi,《需求模型未知的动态定价:渐进最优半近视政策》,运筹学62(5)(2014)1142–1167。统一资源定位地址https://doi.org/10.1287/opre.2014.1294【74】P.Joulani,A.Gyrogy,C.Szepesv'ari,《延迟容忍在线凸优化:统一分析和自适应梯度算法》,载于:第三十届AAAI艺术智能会议论文集(AAAI-16),美国亚利桑那州凤凰城,2016年,第1744-1750页。统一资源定位地址https://sites.ualberta.ca/~pooria/publications/AAAI16扩展。pdf【75】M.S.Bartlett,《判别分析中的逆矩阵调整》,《数理统计年鉴》22(1)(1951)107–111。内政部:10.1214/aoms/1177729698。【76】J.J.Duistermaat,J.A.C.Kolk,《多维真实分析I:差异》,剑桥高等数学研究院,剑桥大学出版社,麻省剑桥,2004年。内政部:10.1017/CBO978051161671。【77】J.Dugundji,《高等数学拓扑学系列》,Allyn&Bacon,波士顿,1966年。[78]Y.S.Chow,《鞅的局部收敛与大数定律》,《数理统计年鉴》36(2)(1965)552–558。内政部:10.1214/aoms/117700166。【79】D。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 08:51:54
Freedman,关于borel-cantelli引理和强定律的另一个注释,泊松近似作为副产品,概率年鉴1(6)(1973)910–925。内政部:10.1214/aop/1176996800。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群