一周前比利时和法国的价格:此外,虽然不同的法国市场特征,即市场整合特征,似乎对预测准确性起着很大的作用,但结果只足以对法国数据的重要性有一个大致的认识;特别是,在做出任何进一步的结论之前,需要进行统计分析。最后,虽然我们使用了所提出的算法来选择输入特征,但我们尚未对其准确性进行评估。特别是,为了评估其性能,我们可以只使用最佳选择的特性来比较模型,而其他模型也可以使用已禁用的特性;更具体地说,我们可以通过假设检验来评估预测准确性的差异(见第7.2.4节)。7、市场整合与建模框架评估特征选择算法提供的分析基于验证集;虽然此数据集不用于训练网络,但它用于提前停止和超参数优化。因此,为了有一个完全公平和无偏的评估,我们需要使用看不见的数据对整个培训过程进行额外的比较。此外,由于特征选择结果是使用第一个提出的模型获得的,因此还需要第二个模型的结果。最后,为了进行有意义的评估,应计算结果的统计意义。为了满足这些要求,本节的目标有两个:1。通过对测试集所代表的样本数据进行DM测试,提供法国市场数据使用改进的统计意义,即市场整合。2、基于相同的统计检验,证明了双重市场预测师如何能够显著提高预测准确性。7.1.