全部版块 我的主页
论坛 经济学人 二区 外文文献专区
1056 20
2022-06-24
英文标题:
《P2P Loan acceptance and default prediction with Artificial Intelligence》
---
作者:
Jeremy D. Turiel and Tomaso Aste
---
最新提交年份:
2019
---
英文摘要:
  Logistic Regression and Support Vector Machine algorithms, together with Linear and Non-Linear Deep Neural Networks, are applied to lending data in order to replicate lender acceptance of loans and predict the likelihood of default of issued loans. A two phase model is proposed; the first phase predicts loan rejection, while the second one predicts default risk for approved loans. Logistic Regression was found to be the best performer for the first phase, with test set recall macro score of $77.4 \\%$. Deep Neural Networks were applied to the second phase only, were they achieved best performance, with validation set recall score of $72 \\%$, for defaults. This shows that AI can improve current credit risk models reducing the default risk of issued loans by as much as $70 \\%$. The models were also applied to loans taken for small businesses alone. The first phase of the model performs significantly better when trained on the whole dataset. Instead, the second phase performs significantly better when trained on the small business subset. This suggests a potential discrepancy between how these loans are screened and how they should be analysed in terms of default prediction.
---
中文摘要:
将Logistic回归和支持向量机算法以及线性和非线性深层神经网络应用于贷款数据,以复制贷款人接受贷款的情况,并预测已发放贷款违约的可能性。提出了一种两相流模型;第一阶段预测贷款被拒绝,而第二阶段预测已批准贷款的违约风险。Logistic回归在第一阶段表现最好,测试集回忆宏观得分为77.4 \\%$。深度神经网络仅应用于第二阶段,它们是否达到了最佳性能,对于默认值,验证集召回分数为72 \\%$。这表明AI可以改进当前的信用风险模型,将已发行贷款的违约风险降低70美元。这些模型也适用于仅为小企业提供的贷款。当在整个数据集上进行训练时,模型的第一阶段表现明显更好。相反,第二阶段在接受小企业子集培训时表现明显更好。这表明这些贷款的筛选方式与违约预测分析方式之间存在潜在差异。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Risk Management        风险管理
分类描述:Measurement and management of financial risks in trading, banking, insurance, corporate and other applications
衡量和管理贸易、银行、保险、企业和其他应用中的金融风险
--
一级分类:Quantitative Finance        数量金融学
二级分类:General Finance        一般财务
分类描述:Development of general quantitative methodologies with applications in finance
通用定量方法的发展及其在金融中的应用
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-6-24 07:08:13
P2P贷款接受和人工智能违约预测预印本Jeremy D.Turiel计算机科学系LondonGower街,BloomsburyLondon WC1E 6BT,United Kingdomjeremy。图里尔。18@ucl.ac.ukTomasoAste公司*计算机科学系伦敦大学学院和高尔街,布卢姆斯伯兰登WC1E 6BT,联合王国。aste@ucl.ac.ukJuly2019年4月,抽象深度神经网络应用于贷款数据,以复制贷款人对贷款的接受情况,并预测已发放贷款违约的可能性。提出了一种两相流模型;第一阶段预测贷款拒绝,第二阶段预测已批准贷款的违约风险。LogisticRegression被发现在第一阶段表现最好,测试集召回宏观得分为77.4%。深度神经网络仅应用于第二阶段,它们是否达到了最佳性能,默认情况下的验证集召回分数为72%。这表明人工智能可以改进当前的信用风险模型,将已发行贷款的违约风险降低高达70%。该模型也适用于仅为小企业提供的贷款。当对整个数据集进行训练时,模型的第一阶段表现明显更好。相反,第二阶段在接受小企业子集培训时表现明显更好。这表明这些贷款的筛选方式与违约预测分析方式之间存在潜在差异。P2P借贷·人工智能·大数据·违约风险·金融自动化1简介现代大数据集和开源数据的可用性,以及计算和算法CDATA分析技术的进步,重新激发了人们对这项风险预测任务的兴趣。此外,贷款审批流程的自动化为小企业和个人提供了新的融资机会。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 07:08:16
由于人工处理的高成本,这些银行以前获得信贷的机会更加有限。最终,这一过程的自动化有可能减少人类偏见和腐败,使所有人都能更公平地获得信贷。金融技术对这个正在迅速变化的领域产生了巨大影响[]。这一模型在P2P借贷中的应用只是一个例子,其他例子包括发展中国家的小额融资和逐笔贷款评估用于投资的贷款组合。P2P借贷近年来吸引了业界、学术界和公众的关注。这还得益于主要P2P借贷平台的大规模扩张,如借贷俱乐部(lending Club),该公司目前已向逾300万客户提供了逾450亿美元的贷款。P2P贷款覆盖率和普及率不断提高的另一个原因是其在东欧、南美和非洲欠发达市场的快速扩张。随着该行业在货币和社会方面的相关性不断增强,监管的必要性也随之产生。FCA是为该行业制定规则的常客之一[2,3],这表明了这一趋势在美国以外的发达国家的重要性。*金融计算和分析主管Grouphttp://www.cs.ucl.ac.uk/staff/tomaso_aste/.UCLCentre区块链技术总监http://blockchain.cs.ucl.ac.uk/tomaso-aste/.arXiv:1907.01800v1【q-fin.RM】2019年7月3日预印本-2019年7月4日由于其易于访问的历史数据集,借贷俱乐部是多个调查P2P借贷违约驱动因素的出版物的主题[,]。新兴国家P2P贷款的增长也吸引了研究兴趣,例如[]调查墨西哥的贷款。这突出了P2P贷款在为新兴国家的人口提供信贷方面的关键作用。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 07:08:19
跨学科科学界,如网络科学界,也开始对P2P借贷的社会经济动态表现出兴趣[]。更多的理论研究也探讨了P2P借贷需求和增长的原因。由于借贷对手之间的信息不对称,这通常与信贷配给的概念有关[]。小额金融机构是解决信贷配给问题的一个办法,其重点是允许公平获得信贷和减少贫困。《艾德·马加津》(iredmagazine)杂志主编克里斯·安德森(ChrisAnderson),Serrano Cinca等人已经确定了“少卖有自我维持的商业模式”的概念。他们已经提出,技术将允许降低成本和利率,从而导致类似电子商务的革命【10】。这项工作旨在为这一目标做出贡献。据我们所知,研究P2P贷款驱动因素的学术出版物[,,]已将简单回归模型应用于此任务。这项工作在将大数据和人工智能技术应用于P2P贷款方面迈出了重要的一步,结合了两个主要的颠覆性新兴领域。应用,在第3节中,我们展示了应用于整个数据集的模型第一阶段(第3.1.1节)和第二阶段(第3.1.2节)的结果和相关讨论,第3.2节然后研究了“小企业”贷款中应用的类似方法,第4节从我们的工作中得出结论,然后在第5.2节数据集和方法2.1数据集中确认接受贷款的总数(蓝色)、拒绝贷款的数量占申请贷款总数的分数(绿色)和申请贷款的总数(红色)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 07:08:22
黑线代表原始时间序列,由于违约贷款比例明显减少,垂直黑线右侧的数据被排除在外,这是因为违约是一个随机累积过程,并且贷款提前偿还36-60。这将构成一个有偏见的测试集。预印本-2019年7月4日https://www.lendingclub.com). 数据集从Kaggle(www.Kaggle.com)下载。贷款、婚礼、房屋相关贷款、小企业贷款和其他贷款。其中一个数据集包含被信贷分析师拒绝的贷款,而另一个数据集包含数量明显更高的贷款,表示已接受的贷款,并显示其当前状态。我们的分析涉及这两个方面。第一个数据集包含超过1600万笔被拒绝的贷款,但只有9个特征。第二个数据集包括≈ 15≈ 由于没有可用的默认或付款结果,已从数据集中删除800000800000作为“当前”。已选择Accepted600000150000贷款的数据集进行分析,并将此功能用作默认预测的目标标签。“10%≈ 已发放贷款总额的50%。拖欠贷款代表15- 已发放贷款的20%进行了分析。在目前的工作中,第一阶段的特征被简化为两个数据集之间共享的特征。例如,贷款申请人的地理特征(美国州和邮政编码)被排除在外,即使它们可能是信息性的。第一阶段的特点是:1)债务收入比(申请人);2) 就业期限(经验学习)。为了获得接受和拒绝贷款日期的共同特征,适用于模型的第二阶段,其中所有日期均与发放日期相对应。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-24 07:08:26
两者的所有数字特征都泄漏到模型中。模型第二阶段考虑的特点是:1)贷款金额(当前申请的贷款);2) (8)债务与收入比率(申请人);9) (申请人)记录中的最早信用额度;10) 未结信用额度的数量(在申请人的信用文件中);11) (申请人)贬损性公共记录的数量;12) 循环额度利用率(借款人使用的信贷金额相对于所有可用的循环信贷);13) 信贷额度总数(在申请人的信贷文件中);14) 抵押贷款信用额度数量(申请人的信用对数是为了缩放);17) (申请人的)FICO分数;18) (申请人)总信用转帐余额的对数。排除了为数据集的有限部分(少于70%)提供信息,缺失数据通过平均插补进行查询。这不应该对我们的分析产生相关影响,因为累积平均插补值低于总体特征数据的10%。此外,统计数据是针对每个至少10000笔贷款的样本计算的,因此计算结果不应产生偏差。数据集统计数据的时间序列表示如图1所示。与此数据集(或其早期版本,如[])的其他分析不同,此处用于违约分析,我们仅使用贷款机构在评估贷款和发放贷款之前已知的特征。例如,一些在其他作品[]中发现非常相关的特征被排除在该领域的选择之外。这里没有考虑的最相关的特征之一是利率和俱乐部分析员指定的等级。事实上,我们的研究旨在为贷款机构找到与违约预测和贷款回吐先验相关的特征。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群