公众号:番茄风控大数据
各位番茄风控的读者大家好,我是小番。之前有一些从事传统信贷审批的同学在咨询:如何从传统的信贷转型到数据分析岗和数据模型岗。今天我们就来分享下,加入到我们的知识星球的同学小C是如何从传统的信贷审批岗转型过来的。本文,我们将从线下审批到线上化作业的内容,这两部分工作展开的要点阐述。
各位同学,大家好。我是我是番茄学院创作组成员小C。今天来给大家分享下我从事风控以来的转型之路。
一.线下的信贷审批
以前做信贷审批;关注的是客户本身的风险;一般会关注客户几个方面:
以上我们就这里的模块一一展开阐述。
1.客户评级
主要指的是信用评级A-H;由征信数据和三方数据各一套模型评级叠加而来;
2.客户申请城市
3.客户是否触发黑灰名单
一般公司都有个黑名单库,比如客户命中本公司的严重逾期名单,对于这部分客户是直接拒绝的。灰名单是曾经出现逾期,但也不算是特别严重的逾期。命中灰名单,不会拒绝,而是会参考其他维度进行进一步的考量。
4.客户内匹关联风险(关联图谱)
关联图谱是风险突破口和识别欺诈、发现团伙的重要线索,一般金融公司都会创建,但是能起到非凡效果的一般都是由丰富数据源的大公司。大公司的知识图谱数据大多来源于自己的集团库;数据体量一般是上亿级别;
除此之外,还会用到比如说时间序列信息,构建动态关系图谱等增强对数据的充分应用性,以此来获取更多的有效信息,以便能更有效的预测和发现风险。关联图谱信息一般包含设备号,手机号,姓名,身份证,关系,单位名称,贷后情况,欺诈情况等信息。
举个常用的例子,客户填写联系人手机号,触发到一年内手机号一致,姓名不一致的条目,就视为是异常的,需要审批取交叉验证核实;
所以在使用这个关联图谱的过程中,我们也是应用外部的平台进行关联图谱的风险查找去发现相应的风险。
5.客户人行信息和表填信息是否一致
6.客户联系人情况
这里会关注是否有配偶,是否有直系亲属,联系人信息是否可查;一般会通过微信,支付宝等方式核验是否人号匹配。
7.客户资产情况,负债比
举个例子:针对低评级的客户,一般会询问客户有无在途小贷,并与征信上贷款信息核对,确定是否同一笔贷款。如果不是,需要咨询客户这笔没有上征信的贷款还款方式,是否每月还款,每月还款金额,并将此笔月还金额录入系统。
低评级客户一般还款能力,还款意愿相对优质客户会比较差。如果额外负债还比较多,将很可能直接影响到客户准入问题。高评级的客户能承担的负债比会高一些。基本趋势如下表,值可根据实际情况进行测算。
8.客户贷款用途
与联系人,尤指配偶和直系交叉验证客户贷款用途,并根据客户实际工作情况等综合判断此用途是否合理;比如说客户说用来买车自己开,但是与客户配偶核实到两夫妻都没有驾照,就可认为贷款用途不合理,需要跟客户进一步确认。
9.客户提供资料是否虚假
一般是流水类虚假,但是随着大数据的普及,很多资料已经不需要客户手动提供了。
10.客户单位等情况
客户提供单位信息是否可查;客户是否是优良行业等等;例如,三方反查客户留的单位电话。如果能查到,基本确定单电真实。
前面说到随着大数据的流行,很多数据已经不再需要人工核查,使用数据自动检验、自动化审批也将成为趋势,很多风控作业也将往数字平台转型。而线上风控部门主要包括的工作有数据分析、策略分析、模型开发,所以在这个标准化的职业发展道路中,数据分析是流程中的第一环节。而本人也有幸在这波浪潮中成功转型。
二.线上的数据分析
转岗数据分析是机缘巧合,因为在审批岗位表现还算不错,然后又有一点点sql代码功底,经朋友推荐就成功转岗到了运营数据分析室。展开了由单纯的识别单个客户风险,转为识别群体风险之路。
转型之路充满了挑战,最开始的转型,我主要做了以下几项分析:
1. 贷后数据不好的客户有哪些共性特征;
2. 核实定性为欺诈或黑灰名单的客户有哪些共性特征;
3. 哪些客户出现了异于常理的关联性特征;
4. 操作岗同事或者机构的各项KPI指标监控和合规性监控问题;
以下我们分别一一阐述:
2.1.有标签数据的数据分析
可以发现上述情况中,第1、2点有Y变量,带标签。
Y变量的定义一般是既定发生的数据,已经逾期客户或者已经核实确认是欺诈类型客户,具体取数口径根据实际业务需求来。
举个例子:
a. 信贷行业,一般有团体欺诈套现情况,逾期会暴漏的比较早,我们可取首逾当Y值;
b. 横向对比各个团队或各个业务员首逾占比相对整体平均值高3倍及以上;
c. 我们就要提这些团队或业务员操作的单子出来,再仔细分析。纵向对比这些团队和业务员的首逾值,看下首逾占比近两年内是否平稳,近期是否上升。
d. 若近期有上升,就将近期上升的单子明细提出来,看下地域,工作单位等有无明显集中。
e. 若集中明显,基本就可以认为异常的可能很高了,将这类案件提交反欺诈,由反欺诈同事代为核实确认。
f. 确认反欺诈,对应追责;策略禁入;
X变量就尽可能多了,简单摘取了一小部分比较典型的字段。
2.无标签的数据分析
上述第3点没有Y变量,前两条的用途一般是做策略禁入方案和差异化管理方案。第3点的用途一般用来做关联分析,机构管理会经常用到,比如说监控一些机构进件质量迁移情况,有没有团体欺诈等等,
关联分析就更依赖业务经验一些,举一个常用的核实团体欺诈的例子,比如说同一个业务员短时间内进了很多七八线城市的客户,某一个很小的单位短时间内多人申请等等;
3.常规的报表的数据分析
最后一条是各项指标的监控,就不过多介绍,列个表格展示下其中一部分工作内容;
三.总结
细心的小伙伴们就能发现,数据分析和审批要关注的点大多都相似,区别仅在于逻辑思维转换和量化数据,由识别单个客户风险到识别团体风险,就是一种逻辑思维的转换。审批在审核案件时有主观能动性,而数据分析一般都要根据数据说话。
我们在处理数据中,怎么样量化X特征变量,怎么定义Y变量,怎么定义聚类异常指标,怎么批量处理数据,对于初步迈进数据分析的小伙伴来说,都是要学习的难题,当我们能够通过量化数据识别出群体风险的时候,我们基本在数据分析的行业算入门了。列举了这两部分的异同点,如下:
当然还有个最重要的技能要学习—写代码,代码建议初始先熟悉sql,因为从很多数仓取数会用得到,也是最基本的语法,然后再学一些统计学工具,比如sas,python,这些都是市面上比较常用的,后边追求高一点,再学一点BI展示,就显得稍微高大上一点哦。
后面我也将自己在平常工作中所实操的一些代码跟数据整理,上传到知识星球平台,各位同学有兴趣的也可以上去获取相关资料,谢谢大家。
以上就是我的转型历程中的部分内容,今天的文章我先做一个开始。接下来的文章中我将对其中的一些数据分析点再进行阐述。最近遇到的疫情,对于风险控制部也提出了一些挑战。下次我们就来集中谈一谈疫情期间如何调整风险策略。