经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
大数据分析
风控必知必会|两大逻辑表&五大基础报表
楼主
滨滨有利123
708
0
收藏
2021-08-24
在系统数据中,有两大重要的数据逻辑报表,分别是状态表(status)与操作日志(log表)。在这两大类型的数据报表中,状态表是经常取数交互,常用到的一张报表。比如在风控系统中,如客户是否通过审核,是否授信放款,对于客户数据在这个表里始终只有唯一一种状态,因为最终的状态都会覆盖上一次记录,大家都会对这个报表相对熟悉一些。而对于中间表(log表),因为不直接使用且在实操过程中,稍有不慎就会引发风险。
一.两大逻辑表
状态表:
记录当下时间,或者当天的状态,覆盖历史的状态。
如上述中我们提到的申请表就是状态表,申请的状态,可能下午1点的时候,在审核中,下午3点审核拒绝。但最终申请表,只记录状态,所以这个申请的状态就是拒绝,覆盖了上一个审核中的状态。
如果需要确定当时的状态,两种方式,一种是结合log表进行计算,一种是建立每天的snapshot(也就是我们常说的数据快照)。
log表:
记录从开始到现在所有的数据,有一次操作或者更新就记录一条。
例如刚刚的申请表,就可以对应一张申请的log表,点击申请按钮,直接进入审核中,增加一条记录,当审核完成增加一条审核完成的记录。所以对于日志表而言,一般都是一对多的关系。
以上的两大类型的报表,都是重要报表。开篇提到的风险,如近期跟一位同行的老师交流,他们在系统中因为不慎做了一个覆盖记录,即:将逾期结清后把逾期天数都给清零了。可以近似理解为中间的log表几乎都清空了,只保留最终状态的数据。
有同学也许会有疑问,具体场景中,清除了这个中间数据(log表)在具体场景中有什么影响?
回答这个问题,我们来看一下在贷后数据相关的策略内容中,经常会用到一些中间数据,比如某小贷跟逾期催收相关的策略有以下内容:
在以上的策略中,在月末的时候,客群都有自愈可能,但曾经的逾期的天数都是能判断客群风险的历史数据。
中间操作记录,不管是策略,也是在模型相关的特征衍生中重要的变量特征,特别是跟时间切片相关的中间变量:
说到这里的曾经逾期的数据,相关的操作记录还有涉及用中间的逾期记录去做相关的逾期客群分层分析:
以上都是中间过程数据的重要性,既然提到报表,那在风控中还有五大重要基础报表也不得不提,相关的内容分别是:注册表、个人信息表、申请表、放款表、还款表。
二.五大基础报表
注册表:
PRIMARY KEY(`id`),
注册成功的客户,进入这张表。这张表的id肯定是borrower_id了
个人信息填写表:
PRIMARYKEY (`id`), UNIQUE KEY ` borrower_id `,每个人,每次提交个人信息,就会有一条记录
申请表:
PRIMARY KEY(`id`), UNIQUE KEY ` borrower_id ` (` borrower_id`)。
每个人不同时间可以申请多次,每申请一次,就会有一条记录,包括申请的金额,申请结果。list_id对应了后面结果通过后是否提现,放款等。
放款表:
也是还款计划表,PRIMARYKEY (`id`),KEY ` borrower_id ` (` borrower_id),KEY `idx_list_id`(`list_id`) 。
申请通过,并且放款成功的进入这张表。显示这笔借款(或者其中的某一期),应还的本金,利息,手续费,到期日等,实际是否还款,还了多少本金,利息等。但是这张表上每天的状态,假设客户今天还款100元,明天还款100元,那这张表最终会显示客户还款200元。没有办法通过这张表回溯前一天的时间点的情况。
还款表:
PRIMARYKEY (`id`),KEY ` borrower_id ` (` borrower_id ),KEY `idx_list_id`(`list_id`)
实际是一张还款的log表,还款计划表的实际还款金额是根据这张表计算的来,可以知道每天的还款情况。
以上相关报表都是风控中极为重要的几张报表,后面无论我们写的滚动率、迁徙率和账龄,基本都是以基础报表为逻辑书写的内容,关于这一part我们后面还有更详细的内容分享。
~原创文章
...
end
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
JP --China--snapshot--20071220--ENGLISH VERSION
2038.HK_富士康國際_Company_Snapshot_Chinese_020909
China Market Snapshot_090720_花旗
Kingsway-HK & China Snapshot-20101119
好奇的问一下~池子的问题和这个报道有关没?
博弈论
Snapshots_from_Hell-The_Making_of_an_MBA
Q3-2021-Pharma-Services-Sector-Snapshot
Q3-2021-Branded-Generic-Pharma-Sector-Snapshot
币圈小将:DAO如何改变我们的工作方式
栏目导航
大数据分析
经管文库(原现金交易版)
行业分析报告
经管在职研
外文文献专区
机器学习
热门文章
我该如何记住你?智能体记忆系统的演化之路
2026年Agent领域十大趋势判断
低空经济发展报告(2025-2026)
无上高明的“无为”“无住”哲学在传统中国
现代数学基础 现代极限理论及其在随机结构中 ...
高教现代数学基础15 有限群表示论 曹锡华,时 ...
第一太平戴维斯 - 2026年中国房地产市场展望 ...
科研时间70%耗在“下载-复制-粘贴”?零代码 ...
精准匹配,菁英相伴--经管之家单身俱乐部, ...
找读书搭子
推荐文章
2026JG学术冬训营:从Stata初高到Python机器 ...
【必看】【本版版规,欢迎发悬赏贴求助】
26年寒假天津站|Gemini论文写作&数据分析 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群