为了选择核中心,对于KMN,我们在yidata点上使用K-means聚类。在每个选定的中心,我们放置两个初始标准偏差σ=0.7和σ=0.3的高斯。虽然高斯函数的位置在训练过程中是固定的,但尺度/标准差参数是可训练的,并由优化器进行调整。表III概述了默认的超参数。MDN KMNhidden层尺寸(16,16)(16,16)隐藏非线性tanh tanhtraining epochs 1000 1000 ADAM学习率0.001 0.001K:组件数量20 50ηx:噪声标准x 0.2 0.2ηy:噪声标准y 0.1 0.1权重标准化True Truedata标准化True Trueinitialization of scales-[0.7,0.3]可训练量表-TrueTable III MDN和KMn的默认超参数配置通过超参数选择的基准研究(见图II),通过10倍交叉验证网格搜索优化了参数子集。由于搜索空间随要优化的参数数量呈负增长,我们将网格搜索限制在对估计器性能影响最大的超参数上。在MDN和KMN的情况下,这些是训练次数、混合成分的数量和噪声正则化强度。对于LSCDE,搜索包括核数、带宽和阻尼参数λ。表IV包含通过参数搜索确定的超参数,随后用于拟合和评估相应的估计器。MDN-CV KMN-CV LSCDE CVtraining epochs 500 500 K:组件数量10 200 1000ηx:噪声标准x 0.3 0.2ηy:噪声标准y 0.15 0.15带宽??0.5λ:LSCDE阻尼参数??0.1表IV超参数配置通过EuroStoxx 50数据集附录F上的10倍交叉验证确定。