请记住,这些模型之间的主要区别在于模型2中的分类,它使用客户数据的潜在表示。因此,我们的结果与先前的研究一致,这些研究显示了潜在转换中的预测能力。值得进一步注意的是,我们提出的拒绝推理模型不仅表现得更好,而且还估计了预测违约概率的更高可变性,如表A4所示。这一结果支持了之前的发现,即如果忽略拒绝推理,默认概率会被低估。不幸的是,鉴于本研究中数据集的性质,我们无法就这一有趣细节的经济影响得出任何结论。值得一提的是,对于LendingClub数据集,模型2是需要更长时间才能收敛的算法,而对于Santander信用卡数据集,则是S3VM。在任何情况下,在表3的实验中,模型2和S3VM的运行时间都是适中的。在表4中,我们使用模型2和借贷俱乐部数据集分析了接受和拒绝申请的数量对模型性能的影响。在右侧的面板中,我们可以看到一般趋势是,我们向模型2添加的被拒绝的应用程序越多,模型性能就越高。在左面板中,我们可以看到,我们拥有的数据越多,受监督模型的模型性能越好,与模型2相比差异越小。请注意,模型2在所有场景中达到了最高的平均AUC 0.6404,其中包括545 599个观测值。这比自训练SVM和S3VM处理的数据多16倍。与表3相比,使用所有被拒绝应用程序的实验中模型2的运行时间显著增加。