全部版块 我的主页
论坛 经济学人 二区 外文文献专区
2022-6-14 06:04:06
结论本文研究了神经网络在条件密度估计中的应用。为了解决过拟合问题,我们引入了一种噪声正则化方法,该方法可以实现平滑的密度估计和改进的泛化。此外,还提出了一种归一化方案,使模型的超参数对不同的值范围不敏感。相应的实验表明了所提出方法的有效性和实际重要性。在一项基准研究中,我们证明了我们的训练方法使基于神经网络的CDE具有比以前的半参数和非参数方法更好的样本外性能。总的来说,这项工作为基于神经网络的CDEin在计量经济学等领域的成功应用建立了一个实用框架。基于这些有希望的结果,我们确信,所提出的方法增强了计量经济学工具包,因此提倡在这一方向上进行进一步的研究。虽然本文主要研究混合密度的CDE,但未来研究的一个有希望的途径可能是使用归一化流作为参数密度表示。附录附录A.噪声正则化设LD(D)是一组数据点D={x,…,xN}上的损失函数,可以将其划分为与每个数据点xN相对应的损失之和:LD(D)=NXi=1L(xN)(1)同样,设每个xnbe受到随机噪声向量ξ的扰动~ q(ξ),具有零均值和i.i.d.元素,即ξ~q(ξ)[ξ]=0和Eξ~q(ξ)hξnξ>ji=ηI(2)由此产生的损失L(xn+ξ)可通过围绕xnL(xn+ξ)=L(xn)+ξ>xL(x)xn+ξ>xL(x)xnξ+O(ξ)(3)假设噪声ξ在其量级上很小,可以忽略。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 06:04:09
q(ξ)的预期损失直接来自(3):Eξ~q(ξ)[L(xn+ξ)]=L(xn)+Eξ~q(ξ)hξ>xL(x)xni+Eξ~q(ξ)hξ>xL(x)xnξi(4)利用(2)中关于ξ的假设,我们可以将(4)简化如下:Eξ~q(ξ)[L(xn+ξ)]=L(xn)+Eξ~q(ξ)【ξ】>xL(x)xn+Eξ~q(ξ)hξ>xL(x)xnξi(5)=L(xn)+Eξ~q(ξ)hξ>h(n)ξi(6)=L(xn)+Eξ~q(ξ)XjXkξjξkL(x)x(j)x(k)xn公司(7) =L(xn)+XjEξξjL(x)x(j)x(j)xn+XjXk6=jEξ[ξjξk]L(x)x(j)x(k)xn(8)=L(xn)+ηXjL(x)x(j)x(j)xn(9)=L(xn)+ηtr(H(n))(10),其中,L(xn)是无噪声损耗,H(n)=xL(x)xn在xn的L的Hessian。用ξjwe表示列向量ξ的元素。附录B.变量引理1的数据规范化和变化:Let x∈ S Rnbe是一个具有概率密度函数p(x)的连续随机变量。任意线性变换z=a+x的Bx~ 带a的p(x)∈ Rnand B是可逆的n×n矩阵,遵循概率密度函数q(z)=B | pB-1(x- (a), z∈ {a+Bx x∈ S} 。(11) 证明1(引理1的证明):引理直接来自变量变化定理(见Bishop(2006)第18页)定理3:Let x∈ Rnbe是高斯混合模型(GMM)下的连续随机变量,这是x~ p(x),其中p(x)=KXk=1wkN(uk,∑k)。(12) 任意线性变换z=a+x的Bx~ 带a的p(x)∈ Rnand B是可逆的n×n矩阵,遵循高斯混合模型,密度函数p(z)=KXk=1wkN(a+Buk,B∑kB>)。(13) 证明2(定理3的证明):用x∈ RN根据高斯混合模型,其概率密度函数可以写成asp(x)=KXk=1wkN(uk,∑k)=(2π)KXk=1wkexp-(十)- uk)>∑-1k(x- uk)|∑k |(14)设z~ q(z)是x的线性变换z=a+Bx~ 带a的p(x)∈ Rnand B是一个可逆的n×n矩阵。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 06:04:13
引理1得出P(z)=(2π)KXk=1wkexp-(B)-1z- B-1a级- uk)>∑-1k(B-1z- B-1a级- uk)|B |∑k |(15)=(2π)KXk=1wkexp-(z)- (a+Buk))>(B-1)>Σ-1kB-1(z)- (a+Buk))|B |∑k |(16)=(2π)KXk=1wkexp-(z)- (a+Buk))>(B∑kB>)-1(z)- (a+Buk))|B∑kB>|(17)=KXk=1wkN(a+Buk,B∑kB>)附录C。密度模拟本节详细描述了第五章中用于实验的模拟条件密度。图6说明了各自的条件密度。附录C.1。经济密度(Econdensity)这种简单、经济的分布具有以下数据生成过程(x,y)~ p(x,y):x=|x |,x个~ N(0,1)(18)σy=1+x(19)y=x+yy~ N(0,σy)(20)条件密度遵循asp(y | x)=N(y |u=x,σ=1+x)(21),如图6a所示。人们可以想象x代表金融市场的波动性,在罕见的大规模变现中,波动性总是正的。y可以是任意变量,可以用波动率来解释。我们选择x和y之间的非线性关系来检查估计量是如何与之配合的。为了使事情变得更加困难,在高x实现时,x和y之间的关系变得更加模糊,如异方差σy所示,即随着x的增加而增加。这反映了在高波动时估值器中高噪声的常见行为。附录C.2。ArmaJumps此模拟器的底层数据生成过程是一个带有jumpcomponent的AR(1)模型。时间序列的新实现xt可以描述如下:xt=[c(1- α) +αxt-1] + (1 - zt)σt+zt[-c+3σt]t型~ N(0,1),zt~ B(1,p)(22),其中,c∈ R是AR(1)过程的长期平均值,α∈ R构成自回归因子,描述AR(1)时间序列返回其长期平均值c的速度。典型的无马尔玛过程受到高斯白噪声σ的干扰t标准偏差σ∈ R+。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 06:04:16
Weadd a jump component,以概率p出现,由伯努利分布的二进制变量zt表示。如果发生跳跃,与c大小相同的负冲击伴随着高斯噪声,其标准偏差比正常值高出三倍。动态是一类跳跃式差异模型的离散版本,在债券和期权定价中大量使用。这里,对于每个时间段t,条件密度p(xt | xt-1) 应进行预测。注2 0 0 2 0 0 2 0 0 0 0.000.050.100.150.200.250.300.35条件概率密度x=0.10x=0.50x=1.00(a)经济密度0.2 0.1 0.0 0 0.1 0.2 0.3Y01234567条件概率密度x=-0.10x=0.00(b)ARMAJump0.3 0.2 0.1 0.0.1 0.2 Y024681012条件概率密度x=-0.50x=0.00x=0.70(c)斜态正态分布0.00.10.20.30.40.50.6条件概率密度x=-1.00x=0.00x=1.00(d)高斯混合图6。条件密度模拟模型。不同模拟模型对应的条件概率密度。彩色图表示概率密度p(y | x),以x的不同值为条件。在这种情况下,y对应于xt。条件密度如下所示,为两个高斯的混合物:p(xt | xt-1) = (1 - p) N(xt |u=c(1- α) +αxt-1,σ)+pN(xt |u=α(xt-1.- c) ,3σ)(23)图6b描述了时间序列参数c=0.1,α=0.2,p=0.1,σ=0.05的ARMAJump条件概率密度。如图中所示,条件分布具有负偏度,这是由跳跃分量造成的。附录C.3。SkewNormal数据生成过程(x,y)~ p(x,y)类似于二元联合分布,其中∈ R服从正态分布,y服从正态分布∈ R为条件倾斜正态分布(Andˇel等人,1984)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 06:04:19
偏正态分布的参数(ξ、ω、α)在功能上依赖于x。具体而言,功能依赖性如下:~ N·u = 0, σ =(24)ξ(x)=a* x+b a,b∈ R(25)ω(x)=c* x+d c,d∈ R(26)α(x)=α低+1+e-x个* (α高- α低)(27)y~ 倾斜正常ξ(x),ω(x),α(x)(28)相应地,条件概率密度p(y | x)对应于斜正态密度函数:p(y | x)=ω(x)Ny- ξ(x)ω(x)Φα(x)y- ξ(x)ω(x)(29)其中,N(·)表示密度,Φ(·)表示标准正态分布的累积分布函数。形状参数α(x)控制分布的偏度和峰度。我们将α设为低=-4和αhigh=0,使p(y | x)具有负偏度,该偏度随着xin的增加而减小。这种分布将允许我们评估存在偏态时密度估计器的性能,这是我们在金融市场变量中经常观察到的一种现象。图6C显示了条件偏正态分布。附录C.4。高斯混合联合分布p(x,y)遵循GMM。我们假设x∈ RMAD y公司∈ Rlcan befactorized,即当x和y可以如(30)中所示进行因式分解时,p(x,y)=KXi=1wkN(y |uy,k,∑y,k)N(x |ux,k,∑x,k)(30),条件密度p(y | x)可以表示为:p(y | x)=KXi=1Wk(x)N(y |uy,k,∑y,k)(31),其中混合物权重是x:Wk(x)=wkN(x |ux,k,∑x,k)PKj=1wkN(x |ux,j,∑x,j)(32)的函数。有关详细信息和推导,请感兴趣的读者参阅Guang Sung(2004)和Gilardi et al.(2002)。图6d描述了具有5个分量的GMM的条件密度(即K=5和1维x和y(即l=m=1))。附录D。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 06:04:22
基准研究中的条件密度估计本节详细描述了CDE方法,与基准研究中的方法相比:o条件核密度估计(CKDE):这种非参数条件密度方法使用KDE估计联合概率^p(x,y)和边际概率^p(x)(见第II.a.2节)。条件密度估计如下:密度比^p(y | x)=^p(x,y)^p(x)。为了选择核的带宽hx和hy,采用了Silverman(1982)的经验法则:h=1.06^σN-4+d(33),其中,N表示样本数,^σ表示经验标准偏差,d表示数据的维数。经验法则假设数据遵循正态分布。如果该假设成立,则所选带宽h被证明是最优的w.r.t.theIMSE标准通过交叉验证选择带宽的CKDE(CKDE-CV):与上述CKE类似,但带宽参数Hx和hyare是通过留一个最大似然交叉验证确定的。有关基于交叉验证的带宽选择的更多详细信息,请参见Li和Racine(2007)-邻域核密度估计(NKDE):用于估计条件密度p(y | x),-邻域核密度估计在局部区域采用标准核密度估计-查询点周围的邻域(x,y)(杉山和竹内,2010)。NKDE与CKDE类似,因为它使用放置在训练数据点中的核来估计条件概率密度。然而,NKDE不是同时估计联合概率(x,y)和边际概率p(x),而是通过仅考虑训练样本{(xi,yi)}i的局部子集来形成密度估计∈九、,, 其中Ix,是一组样本指标,如| | xi- x个||≤ .
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 06:04:25
估计密度可表示为asp(y | x)=Xj∈九、,wjlYi=1h(i)Ky(i)- y(i)jh(i)!(34)其中wjis是第j个核的权重,K(z)是核函数。在我们的实现中,K是标准正态分布的密度函数。重量wjcaneither应均匀,即wj=| Ix,|或与距离| | xj成比例- x | |。带宽向量h=(h(1,…,h(l))用经验法则确定(见等式33),其中样本数N对应于训练数据中邻居的平均数:N=NNXn=1 | Ixn,| - 1(35)o最小二乘条件密度估计(LSCDE):将条件密度计算为核的线性组合的半参数估计(Sugiyama和Takeuchi,2010)。^pα(y | x)∝ αTφ(x,y)(36)由于其对高斯核函数φ的线性组合的限制,最优参数αw.r.T.积分均方目标j(α)=Z Z(^pα(x,y)- p(x,y))p(x)dxdy(37)物镜可以用闭合形式计算。然而,同时,线性假设使得估计器的表现力不如KMN或MDN。详见附录Sugiyamaand Takeuchi(2010)。附录E.超参数设置和选择本节列出并描述了用于经验评估的超参数配置。在这方面,我们首先关注图5和表1中基准中使用的默认配置。神经网络有两个隐藏层,每个层有16个神经元,tanh非线性和权重归一化(Salimans和Kingma,2016)。对于KMN,我们使用K=50高斯混合分量,对于MDN,K=20分量。使用Adam优化器对神经网络进行1000个时代的训练(Kingma和Ba,2015)。其中,Adam学习率设置为α=0.001,最小批量为200。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 06:04:28
为了选择核中心,对于KMN,我们在yidata点上使用K-means聚类。在每个选定的中心,我们放置两个初始标准偏差σ=0.7和σ=0.3的高斯。虽然高斯函数的位置在训练过程中是固定的,但尺度/标准差参数是可训练的,并由优化器进行调整。表III概述了默认的超参数。MDN KMNhidden层尺寸(16,16)(16,16)隐藏非线性tanh tanhtraining epochs 1000 1000 ADAM学习率0.001 0.001K:组件数量20 50ηx:噪声标准x 0.2 0.2ηy:噪声标准y 0.1 0.1权重标准化True Truedata标准化True Trueinitialization of scales-[0.7,0.3]可训练量表-TrueTable III MDN和KMn的默认超参数配置通过超参数选择的基准研究(见图II),通过10倍交叉验证网格搜索优化了参数子集。由于搜索空间随要优化的参数数量呈负增长,我们将网格搜索限制在对估计器性能影响最大的超参数上。在MDN和KMN的情况下,这些是训练次数、混合成分的数量和噪声正则化强度。对于LSCDE,搜索包括核数、带宽和阻尼参数λ。表IV包含通过参数搜索确定的超参数,随后用于拟合和评估相应的估计器。MDN-CV KMN-CV LSCDE CVtraining epochs 500 500 K:组件数量10 200 1000ηx:噪声标准x 0.3 0.2ηy:噪声标准y 0.15 0.15带宽??0.5λ:LSCDE阻尼参数??0.1表IV超参数配置通过EuroStoxx 50数据集附录F上的10倍交叉验证确定。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 06:04:30
Euro Stoxx 50数据下节详细描述了第六章中使用的EuroStoxx 50数据集。数据包括3169个交易日,从2003年1月到2015年6月。我们将任务定义为预测1天日志回报的条件概率密度,条件是14个解释变量。这些条件变量如下所示:olog ret last period:前一交易日的已实现对数回报olog ret risk free 1d:无风险的1天对数回报,根据隔夜指数SWAP利率(OIS)计算,到期日为1天。OIS速率rf转换为log(rf+1)。o实变差:估计前一天的实变差,计算为前一交易日的四次10分钟回报之和oSVIX:30天期权隐含波动率(Whaley,1993)obakshiKurt:30天期权隐含峰度(Bakshi et al.,2003)obakshiSkew:30天期权隐含偏斜度(Bakshi et al.,2003)oMkt RF:Fama French市场回报系数(Fama and French,1993)oSMB:Fama French小负大系数(Fama and French,1993)oHML:Fama French高减低系数(Fama and French,1993)oWML:赢家减宽松(动量)系数(Carhart,1997)oMkt RF 10天风险:市场回报风险系数;过去10个交易日的平方市场回报之和oSMB 10天风险:SMB因子风险;过去10天内的平方因子回报之和oHML 10天风险:HML因子风险;过去10天内的平方因子回报之和oWML 10天风险:WML因子风险;过去10天内的平方因子回报之和Pendix G.条件矩的估计本节描述了如何计算条件密度估计值^p(y | x)的矩。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 06:04:33
我们将特别关注均值、协方差、偏度和峰度。默认情况下,中心力矩通过数值或蒙特卡罗积分估计,使用其各自的定义:^u(x)=ZYy^p(y | x)dy(38)^σ(x)=sZY(y- ^u(x))^p(y | x)dy(39)dCov(x)=ZY(y- ^u(x))(y- ^u(x))T^p(y | x)dy(40)\\Skew(x)=ZYy- ^u(x)^σ(x)^p(y | x)dy(41)[Kurt(x)=ZYy- ^u(x)^σ(x)^p(y | x)dy- 3(42)我们的实现只支持估计单变量目标变量的偏度和峰度,即dim(Y)=1。如果dim(Y)=1,则使用高斯求积和10000个参考点,通过数值积分近似积分,计算密度值。如果Dim(Y)>1,我们对100000个样本使用蒙特卡罗积分(见附录??)。期权隐含时刻根据30天内到期的期权计算。由于到期日不同,期权隐含矩的线性插值(对应于到期日的不同天数)用于计算30天内的到期估计。对于KMN和MDN,条件分布是GMM。因此,我们可以直接从神经网络输出的GMM参数计算平均值和协方差。平均值如下所示,即高斯分量中心的加权和:uk(x;θ)u(x)=KXk=1wk(x;θ)uk(x;θ)(43)协方差矩阵可计算为^Cov(x)=KXk=1wk(x;θ)(uk(x;θ)- ^u(x))(uk(x;θ)- ^u(x))T+diag(σk(x;θ))(44)其中,外积说明了组件不同位置产生的协方差,以及每个高斯组件固有方差的对角线矩阵。参考Sambrogioni、Luca、Umut G–u,cl–u、Marcel A.J。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 06:04:36
van Gerven和Eric Maris,2017,《KernelMixture网络:连续随机变量条件密度估计的非参数方法》。安国忠,1996,《反向传播训练中添加噪声对泛化性能的影响》,神经计算8643–674。和ˇel,Ji,Ivan Netuka和Karel Zv\'ara,1984年,关于阈值自回归过程,Kybernetica20,89–106。Bakshi、Gurdip S.、Nikunj Kapadia和Dilip B.Madan,2003,《股票回报特征、偏斜律和个人股权期权的差异定价》,金融研究回顾。Bishop,Chris M.,1995,《噪声训练相当于Tikhonov正则化》,《神经计算》7108–116。Christopher M Bishop,1994,《混合密度网络》。Christopher M Bishop,2006,《模式识别和机器学习》(Springer)。Bollerslev,Tim,Bollerslev,and Tim,1987,预测价格和收益率的条件异方差时间序列模型,经济学和统计学评论69542–47。Botev,Z.I.、J.F.Grotowski和D.P.Kroese,2010,《通过差异估计核密度》,统计年鉴382916–2957。Bowman,Adrian W.,1984,《密度估计平滑的交叉验证替代方法》,Biometrika 71353–360。Cao、Ricardo、Antonio Cuevas和Wensecslao Gonz\'alez Manteiga,1994,《密度估计、计算统计和数据分析中几种平滑方法的比较研究》,17153-176。Carhart,Mark M.,1997,《共同基金业绩的持续性》,金融杂志52,57–82。De Gooijer,Jan G和Dawit Zerom,2003年,关于条件密度估计,技术报告。Dinh、Laurent、Jascha Sohl Dickstein和Samy Bengio,2017年,《使用真实NVP进行密度估计》,摘自《学习表征国际会议论文集》。Duin,R.P。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 06:04:39
W、 1976年,关于概率密度函数Parzen估值器平滑参数的选择,IEEE计算机交易C-251175–1179。Engle,Robert F.,1982,《英国通货膨胀方差估计的自回归条件异方差》,《计量经济学》50987。Fama、Eugene F.和Kenneth R.French,1993年,《股票和债券收益中的常见风险因素》,金融经济学杂志33,3–56。Fama,Eugene F.和Kenneth R.French,2015,五因素资产定价模型,金融经济学杂志116,1-22。Gallant,A.Ronald,D.Hsieh,George Tauchen,A.Gallant,D.Hsieh和George Tauchen,1991年,关于拟合一个顽固的序列:英镑/美元汇率,计量经济学和统计学中的非参数和半参数方法。Gilardi、Nicolas、Samy Bengio和Mikhail Kanevski,2002年,《环境风险图的条件高斯混合模型》,国家自然保护计划。Glosten、Lawrence R、Ravi Jagannathan、David E Runkle、Lawrence R Glosten、Ravi Jagannathan和David E Runkle,1993年,《关于股票名义超额收益率的预期值与波动性之间的关系》,金融杂志481779-1801。Gormsen、Niels Joachim和Christian Skov Jensen,2017,《条件风险》,SSRN ElectronicJournal。Grus,Joel,2015,《从头开始的数据科学》。宋光,Hsi,2004,高斯混合回归和分类,博士论文。Hall、Peter、JS Marron和Byeong U Park,1992年,平滑交叉验证,概率理论92,1-20。Hamilton,James D.(James Douglas),1994年,《时间序列分析》(普林斯顿大学出版社)。Hansen,Bruce E.、Hansen和Bruce,1994,《自回归条件密度估计》,国际经济评论35705–30。Harvey、Campbell R和Akhtar Siddique,1999年,《自回归条件偏斜》,金融和定量分析杂志。Holmstrom,L.和P。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 06:04:43
Koistinen,1992,在反向传播训练中使用加性噪声,IEEETransactions on Neural Networks 3,24–38。Hornik,Kurt,1991,《多层前馈网络的逼近能力》,神经网络4251–257。Hyndman,Rob J.、David M.Bashtanyk和Gary K.Grunwald,1996,《估算和可视化条件密度》,计算和图形统计杂志5315。Jagannathan、Ravi和Zhenyu Wang,1996,《条件资本资产定价模型和预期收益横截面》,金融杂志51,3。Jondeau、Eric和Michael Rockinger,2003,《条件波动性、偏度和峰度:存在性、持续性和共动》,技术报告。Kingma,Diederik P.,和Jimmy Ba,2015,Adam:随机优化方法,inICLR。Krogh·、Anders和John A Hertz,1992年,《简单的重量衰减可以提高通用性》,技术报告。Kukaˇcka,Jan,Vladimir Golkov,and Daniel Cremers,2017,《深度学习的规范化:共济失调》,技术报告。Lewellen、Jonathan和Stefan Nagel,2006年,《条件资本资产定价模型》(conditional CAPM)没有解释资产定价原则,《金融经济学杂志》(Journal of Financial Economics)82289–314。Li、Jonathan Q和Abstract R Andrew Barron,2000年,《NIPS中的混合密度估计》。Li,Qi和Jeffrey S.Racine,2007,《非参数计量经济学:理论与实践》(普林斯顿大学出版社)。Mirza、Mehdi和Simon Osindero,2014,《条件生成对抗网》,技术报告。Nelder,J A和R Mead,1965年,《函数最小化的单纯形法》,ComputerJourna 7,308–313。Nelson,Daniel B.和Charles Q.Cao,1992,《单变量GARCHModel中的不平等约束》,商业与经济统计杂志10229。Park、Byeong、Byeong Park和J.S.Marron,1990年,《数据驱动带宽选择器的比较》,J.STATIST。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 06:04:46
ASSOC 66–72。伊曼纽尔·帕尔岑(Parzen,Emanuel),1962年,《概率密度函数和模式的估计》,数理统计年鉴331065–1076。Pfei ffier,K.P.,1985,《通过不同标准评估的非参数判别函数的核函数平滑因子的逐步变量选择和最大似然估计》,计算机和生物医学研究18,46–61。Rezende、Danilo Jimenez和Shakir Mohamed,2015,《规范化流的变分推理》,第32届国际机器学习会议论文集。Rosenblatt,Murray,1956,《关于密度函数的一些非参数估计的评论》,《数理统计年鉴》27832–837。Rudemo,Mats,1982,《直方图和核密度估计的经验选择》。Salimans、Tim和Diederik P.Kingma,2016,《权重归一化:一种简单的重新参数化,以加速NIPS中深层神经网络的训练》。Sarajedini,A.、R.Hecht Nielsen和P.M.Chau,1999年,《使用sigmoidal神经网络的条件概率密度函数估计》,IEEE神经网络交易10,231–238。Sentana,E.,1995,《二次ARCH模型》,《经济研究评论》62639–661。Shalizi,Cosma,2011,《估计分布和密度》,技术报告。Shecker,S.J.和M.C.Jones,1991,《基于数据的可靠带宽选择方法forKernel密度估计》,皇家统计学会杂志,53683–690。Silverman,B.,1982,关于通过最大惩罚似然法估计概率密度函数,统计年鉴10795–810。Sohn、Kihyuk、Honglak Lee和Xinchen Yan,2015,《使用深层条件生成模型学习结构化输出表示》,神经信息处理系统进展,3483–3491。Sola,J.和J。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 06:04:49
塞维利亚,1997,《神经网络应用于复杂工业问题的输入数据规范化的重要性》,IEEE核科学学报441464–1468。Srivastava、Nitish、Geo Offrey Hinton、Alex Krizhevsky、Ilya Sutskever和Ruslan Salakhutdinov,2014,《辍学:防止神经网络过度匹配的简单方法》,机器学习研究杂志,1929-1958年第15期。Sugiyama、Masashi和Ichiro Takeuchi,2010年,《通过最小二乘密度比估计的条件密度估计》,载于《第十三届国际艺术情报与统计会议论文集》,第9卷,781–788。Tansey,Wesley,Karl Pichotta和James G.Scott,2016,《神经网络的更好条件密度估计》。Tresp,Volker,2001,《高斯过程的混合》,NIPS。Tripe、Brian L和Richard E Turner,2018年,《采用BayesianNormalising流量的条件密度估计》,技术报告。Webb,A.R.,1994,《前馈网络函数逼近:推广的最小二乘法》,IEEE神经网络学报5363–371。罗伯特·惠利(Whaley,Robert E.),1993年,《市场波动性衍生工具:对冲早就应该存在》,衍生工具杂志。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群