信用评分中拒绝推理的深层生成模型

2022-6-25 05:42:57

请记住，这些模型之间的主要区别在于模型2中的分类，它使用客户数据的潜在表示。因此，我们的结果与先前的研究一致，这些研究显示了潜在转换中的预测能力。值得进一步注意的是，我们提出的拒绝推理模型不仅表现得更好，而且还估计了预测违约概率的更高可变性，如表A4所示。这一结果支持了之前的发现，即如果忽略拒绝推理，默认概率会被低估。不幸的是，鉴于本研究中数据集的性质，我们无法就这一有趣细节的经济影响得出任何结论。值得一提的是，对于LendingClub数据集，模型2是需要更长时间才能收敛的算法，而对于Santander信用卡数据集，则是S3VM。在任何情况下，在表3的实验中，模型2和S3VM的运行时间都是适中的。在表4中，我们使用模型2和借贷俱乐部数据集分析了接受和拒绝申请的数量对模型性能的影响。在右侧的面板中，我们可以看到一般趋势是，我们向模型2添加的被拒绝的应用程序越多，模型性能就越高。在左面板中，我们可以看到，我们拥有的数据越多，受监督模型的模型性能越好，与模型2相比差异越小。请注意，模型2在所有场景中达到了最高的平均AUC 0.6404，其中包括545 599个观测值。这比自训练SVM和S3VM处理的数据多16倍。与表3相比，使用所有被拒绝应用程序的实验中模型2的运行时间显著增加。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

何人来此

2022-6-25 05:43:00

在我们使用所有接受和拒绝的应用程序（总共545 599个观察值）的场景中，模型2需要大约4个小时才能收敛。请注意，该模型有16 080个可学习参数，远远超过MLP中的502个参数。通常，训练深度学习体系结构需要大量计算，计算复杂度随参数数量（包括MLP体系结构）线性增加。然而，可以通过在多个GPU上并行分布培训来加速培训。5结论在本研究中，我们开发了两种新的深层生成模型，用于信用评分中的拒绝推理。我们的模型使用贷款结果的后验分布来推断被拒绝申请的未知信用价值。这是通过精确列举贷款的两种可能结果来实现的，这与基于外推的拒绝推理方法相比是一个优势。据我们所知，这是第一项在半监督框架下，利用generativemodels开发出信用评分耦合高斯混合和辅助变量拒绝推理新方法的研究。实验表明，与许多经典和机器学习方法相比，我们提出的模型在信用评分拒绝推理方面取得了更高的模型性能，并且随着我们为模型训练添加更多数据，模型的性能也会提高。此外，深层生成模型中使用的高效随机梯度优化技术可扩展到大型数据集，这是监督和半监督支持向量机的一个优势。请注意，尽管这项研究的重点是信用评分，但我们提出的模型推广到了其他研究领域，例如：。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

何人来此

2022-6-25 05:43:03

图像分类。通过将客户数据的潜在表示添加到分类器中，我们提出的方法的更高模型性能得到进一步增强。此数据表示捕获数据的内在结构，为分类提供相关信息。由于我们提出的信用评分拒绝推理方法提供了灵活的建模可能性，我们希望这项研究能够推动未来利用深层生成模型进行信用评分拒绝推理的工作，重点是提高培训稳定性和分类能力。致谢作者感谢桑坦德消费银行的财政支持和本研究中使用的真实数据集。这项工作也得到了挪威研究委员会（拨款号为260205）和SkatteFUNN（拨款号为276428）的支持。6附录A表格和图为了复制【23】中的数据集，我们排除了表A1中任何变量中缺失值的所有观测值。此外，我们根据[23]选择的允许变量范围由表中所示的最小值和最大值确定。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

mingdashike22

2022-6-25 05:43:07

我们数据样本中的汇总统计数据与[23]中的数据不完全相同，但违约趋势是相同的（2009年违约率为12.59%，2010年为9.61%，2011年为10.32%，2012年为13.76%）。表A1：借贷俱乐部描述性统计变量平均Std最小1分位数中位数3分位数最大接受债务与收入之比14.51 7.19 0.00 9.06 14.44 19.82 34.99贷款金额10 610.34 6 738.61 1 000.00 5 706.25 9 600.00 14 000.00 35 000.00 FICO分数711.49 35.06 662.00 682.00 707.00 732.00 847.50州d1 0.43 0.49 0.00 0.00 1.00州d2 0.43 0.00 0.00 0.00 0.00 0.00 00 1.00状态d3 0.10 0.290.00 0.00 0.00 0.00 1.00就业年限3.97 3.18 0.00 1.00 3.00 6.00 10.00拒绝债务转收入24.29 31.14 0.00 7.90 18 18.19 31.18 419.33贷款金额13 330.74 10 361.51 1000.00 5 000.00 10 000.00 20 000.00 35 000.00 FICO分数638.15 74.10 385.00 595.00 651.00 690.00 850.00州d1 0.47 0.50 0.00 0.00 1.00 1.00州d2 0.37 0.48 0.00 0.00 0.00 1.00 1.00状态d3 0.10 0.30 0.00 0.00 0.00 0.000.00 1.00就业长度8.40 3.16 0.00 10.00 10.00 10.00 10.00我们在本研究中使用的第二个数据集由桑坦德消费银行提供。我们可以提供的有关此数据集的详细信息受到其专有性质的限制。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

栏目导航

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群