我们使用20个阶段的随机梯度下降来最小化交叉熵(两个离散分布(p,q)的交叉熵,K可能不同的值是H(p,q):=-P1级≤我≤Kpilog qi。)。模型识别的数值实验:我们报告了许多实验中的一个作为概念证明:我们在粗糙的Bergomi和Heston曲面的混合物上测试该方法(因此在训练中设置b=0)。为了改变生成的混合物类型,我们选择了∈{0, 0.1, ··· , 0.9, 1}. 对于每个a,混合曲面计算为从粗糙Bergomi和Heston模型中随机选择的曲面的凸组合,并重复20次。该训练集有320000个曲面。为了进一步测试模型的稳健性,使用混合参数的细网格生成验证曲面:a∈ {0, 0.05, ··· , 0.95, 1}. 总的来说,验证集由105000个曲面组成。我们在图5中报告了分类者的效果并对结果进行了评论。图14:神经网络分类的误差取决于混合系数a。图中的每个点对应于给定a的所有混合曲面的神经网络平均估计系数。例如,对于a=0,曲面由粗糙的Bergomimodel生成。对于这些曲面的每个参数组合,我们计算预测混合系数,并在验证集上对所有参数进行平均,以报告^a。网络从不将混合系数设置为非常接近1或0,将曲面归因于一个特定模型。这可以用贝叶斯推理来解释。参考文献【1】E.Al\'os、D.Garc'a-Lorite和a.Muguruza。关于波动性衍生品和异类产品的微笑特性:理解波动率偏差。arXiv:1808.03610,2018年。[2] E.Al\'os、J.Le\'on和J.Vives。