全部版块 我的主页
论坛 金融投资论坛 六区 金融学(理论版)
1234 0
2015-01-13

互联网征信:水中月,镜中花

在无数次期盼和等待后,个人征信业务市场终于放开。央行近日发布了《关于做好个人征信业务准备工作的通知》,允许八家机构做好个人征信业务的准备工作,准备时间为六个月。这八家机构,可谓”八仙过海,各有神通”,其中最受关注的入局者是蚂蚁金服旗下的“芝麻信用”和腾讯旗下的“腾讯征信”。这两家机构或将通过海量的在线数据分析,建立模型来判断用户的信用程度。

       在笔者看来,随着互联网金融业务的高速发展,个人征信体系的建设显得极为迫切,但互联网征信仍面临诸多困境。

        首先,互联网征信业务面临着不能采集敏感的个人信息,数据的安全与透明度等难题。

       出于对信息安全的保护,2013年1月出台的《征信管理条例》,对个人信息的采集做了明确的限制:比如禁止征信机构采集个人的宗教信仰、基因、指纹、血型、疾病和病史信息以及法律、行政法规规定禁止采集的其他个人信息。那么,如何在法律许可的范围内,尽量掌握每个用户完善、丰富的数据信息,又不侵犯用户隐私,就变得非常重要。法律禁止采集的数据恰恰是能反映个人信用的比较关键的数据,这意味着,腾讯征信、芝麻信用等公司必须在大量的“边缘化”数据的基础上,通过反复比对和计算,找出一定的规律。

      在隐私保护层面,腾讯征信、芝麻信用等公司需要在处理用户数据时会先进行“脱敏”处理,即将数据清洗、加工后再使用。这些过程中,必然涉及到数据的安全与透明度的问题,这是需要谨慎对待的。

其次,征信模型是更大的问题,腾讯征信、芝麻信用等公司虽具备大量的用户行为数据,但这些数据与个人的借贷行为关系并不大,因而其建立的模型不一定准确,很难被主流的金融机构引用,在实际预判信用程度时也存在操作性差的问题。

美国征信公司FICO针对个人采集了100多个数据维度,但真正纳入征信模型的只有十几个维度。这其中也是经历了大量的分析运算。

      即便得到了较为贴切的征信模型,也并不意味着不会出现问题,美国最大的P2P平台Lendingclub,曾尝试通过用户在Facebook上的表现来确定其信用度,结果遭遇惨痛的滑铁卢。之后,Lending club转而向美国征信局这一传统机构获得数据,平台上的坏账率随之下降了许多。

      但对于中国民营企业,开展的个人征信业务能否顺利对接央行信用报告的核心数据(如工资收入、社保记录、信用卡记录、贷款记录等),还存在很多不确定性。此前,许多P2P平台就是由于无法对接央行信用数据,而不得不亲力亲为地做征信。眼下,腾讯等企业在一定程度上与银行有竞争关系,要将核心数据共享给竞争对手,对银行来说并不容易。

      最后,数据量大也是较为头疼的问题,因为数据的筛选和清洗是一个非常枯燥复杂的过程。况且,数据量越大,审核维度越多,由此带来的“数据噪音”也越多,模型越失真,这就需要不断地试错,模型稳定性值得商榷。  

      此外,数据里缺乏用户的违约数据,即没有用户真实的贷款记录,因此其模型的精准度大约只有拍拍贷的70%左右。在拍拍贷的风控模型里,用户的社交数据大约只占8%到9%的权重,消费数据的权重也不到10%。相比之下,用户的还款记录、还款行为占到50%到60%的权重。除了缺乏违约数据外,纯线上采集数据同样有着无法回避的劣势。试想一下,如果没有实地探访,没有线下的审核机制把关,单凭身份证和第三方机构出具的报告,哪个银行或金融机构敢放几百上千万的贷款呢?

       腾讯征信、芝麻信用已经在做准备,至于未来能走到哪一步,笔者不报太大的希望,不过民营机构出具的征信报告或能在腾讯、阿里各自的体系内发挥效应。

       互联网征信还有很长的路要走,才能冠看花月。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群