考虑到标准差,表2表明,与A-book客户相比,B-book客户的交易行为稍有波动,这支持了采访中的结论,即优秀的交易员遵循一致的策略。表2还强调了处置效应是一个潜在的区别因素。前十大特征中有几个旨在通过对比交易者保持胜负头寸的持续时间来捕捉处置效果。最后,特征分布的第三和第四时刻暗示了好交易者和坏交易者之间的一些差异。然而,如逻辑回归的失败所示,将这些差异转化为分类规则是困难的,并且可能不可能用线性模型。为了进一步证实这一解释,在线附录提供了使用射频分类器对特征重要性的分析【11】。基于RF的重要性权重(见在线附录第3节)与表2明显不同,根据RF,Fisher评分中十个最重要的特征仅达到中等重要性等级。这可能证明特征响应关系或特征相互作用中存在非线性,这两者都是菲舍尔分数无法适应的。在使用基于信息融合的敏感性分析重新评估特征重要性时,我们在第6.1节中进一步阐述了这一点【58,59】。5.4. 数据组织、评估标准和基准分类我们使用n倍交叉验证来评估ML模型的预测性能。与将数据单独划分为训练集和测试集相比,重复n次建模和评估可以提高结果的稳健性。