全部版块 我的主页
论坛 经济学人 二区 外文文献专区
462 8
2022-06-11
英文标题:
《Robust Classification of Financial Risk》
---
作者:
Suproteem K. Sarkar, Kojin Oshiba, Daniel Giebisch, Yaron Singer
---
最新提交年份:
2018
---
英文摘要:
  Algorithms are increasingly common components of high-impact decision-making, and a growing body of literature on adversarial examples in laboratory settings indicates that standard machine learning models are not robust. This suggests that real-world systems are also susceptible to manipulation or misclassification, which especially poses a challenge to machine learning models used in financial services. We use the loan grade classification problem to explore how machine learning models are sensitive to small changes in user-reported data, using adversarial attacks documented in the literature and an original, domain-specific attack. Our work shows that a robust optimization algorithm can build models for financial services that are resistant to misclassification on perturbations. To the best of our knowledge, this is the first study of adversarial attacks and defenses for deep learning in financial services.
---
中文摘要:
算法是高影响力决策中越来越常见的组成部分,越来越多关于实验室环境中对抗性示例的文献表明,标准机器学习模型并不可靠。这表明,现实世界的系统也容易受到操纵或错误分类的影响,这尤其对金融服务中使用的机器学习模型构成了挑战。我们使用贷款等级分类问题来探索机器学习模型如何对用户报告数据的微小变化敏感,使用文献中记录的对抗性攻击和原始的特定领域攻击。我们的工作表明,稳健的优化算法可以为金融服务建立抗误分类干扰的模型。据我们所知,这是针对金融服务领域深入学习的对抗性攻击和防御的首次研究。
---
分类信息:

一级分类:Statistics        统计学
二级分类:Machine Learning        机器学习
分类描述:Covers machine learning papers (supervised, unsupervised, semi-supervised learning, graphical models, reinforcement learning, bandits, high dimensional inference, etc.) with a statistical or theoretical grounding
覆盖机器学习论文(监督,无监督,半监督学习,图形模型,强化学习,强盗,高维推理等)与统计或理论基础
--
一级分类:Computer Science        计算机科学
二级分类:Cryptography and Security        密码学与安全
分类描述:Covers all areas of cryptography and security including authentication, public key cryptosytems, proof-carrying code, etc. Roughly includes material in ACM Subject Classes D.4.6 and E.3.
涵盖密码学和安全的所有领域,包括认证、公钥密码系统、携带证明的代码等。大致包括ACM主题课程D.4.6和E.3中的材料。
--
一级分类:Computer Science        计算机科学
二级分类:Machine Learning        机器学习
分类描述:Papers on all aspects of machine learning research (supervised, unsupervised, reinforcement learning, bandit problems, and so on) including also robustness, explanation, fairness, and methodology. cs.LG is also an appropriate primary category for applications of machine learning methods.
关于机器学习研究的所有方面的论文(有监督的,无监督的,强化学习,强盗问题,等等),包括健壮性,解释性,公平性和方法论。对于机器学习方法的应用,CS.LG也是一个合适的主要类别。
--
一级分类:Quantitative Finance        数量金融学
二级分类:Risk Management        风险管理
分类描述:Measurement and management of financial risks in trading, banking, insurance, corporate and other applications
衡量和管理贸易、银行、保险、企业和其他应用中的金融风险
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-6-11 05:07:45
稳健的金融风险分类Suprotem K.Sarkar*马萨诸塞州坎布里奇哈佛大学计算机科学系02138suproteemsarkar@g.harvard.eduKojinOshiba*计算机科学系哈佛大学剑桥分校,马萨诸塞州02138kojinoshiba@college.harvard.eduDanielGiebisch*计算机科学系哈佛大学剑桥分校,马萨诸塞州02138danielgiebisch@college.harvard.eduYaron马萨诸塞州剑桥哈佛大学计算机科学系SingerDepartment of Computer Sciences02138yaron@seas.harvard.eduAbstractand越来越多关于实验室环境中对抗性示例的文献表明,标准机器学习模型并不可靠。这表明,现实世界的系统也容易受到操纵或错误分类的影响,这尤其对金融服务中使用的机器学习模型构成了挑战。我们使用贷款等级分类问题来探索机器学习模型如何对用户报告数据的微小变化敏感,使用文献中记录的恶意攻击和原始的领域特定攻击。我们的工作表明,稳健的优化算法可以为金融服务构建模型,以抵抗对扰动的错误分类。据我们所知,这是针对金融服务领域深入学习的对抗性攻击和防御的首次研究。1简介在本文中,我们探讨了依赖机器学习的算法决策系统的鲁棒性。近年来,机器学习已成为金融决策系统的一个组成部分[,,,],通常用于预测贷款违约和确定利率。易受操纵。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 05:07:48
对于图像分类,最近的研究表明,最先进的深度学习模型可能会被愚弄,通过添加小的(尽管很小心)来输出错误的图像标签。社区致力于开发对对抗性操作具有鲁棒性的图像分类器。对于金融应用,如预测贷款违约以确定利率,如果输入数据中的小扰动可能导致这些模型中错误分类的可能性提高,则个人可能会被激励操纵数据:1。输入数据的微小扰动是否会导致分类错误?2、稳健的分类能帮助金融服务中使用的机器学习模型在受干扰的例子中表现更好吗?*Equal ContributionNIPS 2018金融服务业人工智能挑战与机遇研讨会:公平、可解释性、准确性和隐私的影响,加拿大蒙特勒尔。arXiv:1811.11079v1【stat.ML】2018年11月27日请注意,每个特征平均变化1.3%会导致95%的示例出现错误分类。表明稳健优化技术可用于培训对此类金融服务稳健的分类师,并获得以下结果:o95%的输入为1.3%(图1);o低资源信息操纵器。我们表明,当模型以最大值目标进行评估时,我们的稳健分类器的准确率比基准提高了20%。1.1论文组织在第2节中,我们讨论了我们的贷款等级分类和对抗性扰动方法,并描述了我们的稳健优化算法。在第3节中,我们评估了误分类效应交叉扰动类型。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 05:07:51
最后,在第4节中,我们展示了使用我们的鲁棒分类算法进行训练的结果。2方法在本节中,我们介绍了数据集、扰动和本文中使用的鲁棒优化算法。2.1 LendingClub数据多个用户输入的功能,以便通过平台实现从A到G的比传统等级更准确的信用评估,其中A分配最低利率(5-8%)和Gloan等级,以显示对抗性干扰可能影响预期结果的显著程度。我们训练神经网络作为LendingClub构建的分类系统的代理,因为我们无法访问该服务自己的专有模型。具体而言,我们通过训练神经网络从44个连续特征(包括FICO分数、债务收入比和贷款收入比)和6个离散特征(包括状态和负债状态)预测贷款等级。我们的网络使用2个大小分别为100和60的密集ReLU层,其中衰减为0.2,最后使用softmax层来定义7个可能的贷款等级的预测。该体系结构基于安徒生的体系结构,以解决这一分类问题[9]。我们实现了94.46%的测试准确率。2.2干扰类型根据直觉,在预算足够小的情况下,输入中的任何干扰都是“无意义的”,在应用干扰之前,培训和干扰程序中的每个特征。这与贷款等级预测相关,但并非来自相同的支持。快速梯度符号法(FGSM)在损失梯度方向上扰动输入L(θ,x,y)θxy产生扰动x*= x+ 标志(xL(θ,x,y))。与符号[]相反的投影梯度下降(PGD)。此外,在每一步都会重新计算梯度。每个迭代的最大扰动由一个参数剪裁.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 05:07:54
PGD迭代生成扰动样本x*i(达到最大阶跃x*N) ,遵循程序*= x、 x个*i=夹子(十)*我-1+ (x个*我-1L(θ,x*我-1,y)))。基于Jacobian的显著性映射攻击(JSMA)会影响目标标签的丢失[]。JSMA贪婪地增加了j类目标labelFj(x)的概率,显著性图定义为asS(x,t)[i]=(0,如果英尺(x)xi<0或j6=tFj(x)xi>0(英尺(x)xi)| Pj6=tFj(x)xi |,otherwiseJSMA通过持续扰动对显著性影响最大的特征进行扰动.最大显著性攻击(MSA)是我们提出的一种攻击。这种攻击模仿自我报告操作,我们分别以设定的百分比增加或减少对每个特征的扰动,并发现哪种情况下的扰动是由不知道神经网络梯度但可以更改少量特征的代理造成的。算法1 Oracle效率不当稳健优化【12】1:输入:目标L={L,…,Lm},Apx贝叶斯Oracle M,参数T,η2:对于T=1到T do3:wt【i】∝ expηPt公司-1τ=1Li(hτ)4: ht=M(wt)5:结束6:输出:在{h,…,ht}上均匀分布2.3稳健优化算法为了使我们的贷款等级预测分类对这些扰动更加稳健,我们训练我们的模型是,给定一个模型(例如神经网络)和一组扰动,算法可以识别训练。D=(D,…,Dm)L={L,…,Lm}希望在最坏的情况下使损失最小化,即τ=minh∈Hmaxi公司∈[m] Li(h)。在本文的其余部分,我们称之为瓶颈损失。此外,我们假设我们得到了一个α-近似贝叶斯oracleM。也就是说,M(D)可以找到假设h*α-近似于最小预期风险~D[L(h*)] ≤ αminh∈HEL公司~D【L(h)】在我们的设置中,L对应于模型在不同扰动下的损失。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 05:07:58
此外,我们假设在扰动下训练的神经网络是一个α-近似贝叶斯预言。游戏具体而言,该算法在(算法1)上运行乘法权重更新(MWU)。每次迭代,它都会对损失更大的扰动赋予更多的权重。η=plog(m)/2Th*=TPTt=1htsatis fiesmax∈[m] Li(h*) ≤ αminh∈Hmaxi公司∈[m] Li(h)+r2 log(m)t换句话说,该模型可以对扰动分布具有鲁棒性,具有相同的α乘性因子损失,并且随着迭代次数的增加,加性误差变为零。3扰动评估调整并评估更改预测标签的成功性。随着扰动预算的增加,我们评估了扰动列车示例被错误分类的程度。我们发现,小扰动可以有效地通过少量扰动数据来改变贷款类别(图2)。特别是,JSMA展示了针对显著影响神经网络贷款类别预测的特定特征的能力。FGSM基于对所有特征进行恒定量的扰动,与其他方法相比,FGSM在预算扰动大小方面更为不足。PGD可能通过不干扰显著性较低的特征来实现更高的干扰效率。1-MSA只改变了申请人的贷款收入比,尽管受到限制,但表现相当不错。MSA并没有利用神经网络的梯度,这使得它和其他网络相比处于明显的优势。然而,MSA表明,即使是单个预选变量中的一个小变化也很容易影响贷款类别分类。贷款申请图2:(A):对预先训练的分类模型的干扰。横轴是扰动特征的平均百分比变化。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群