全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
1123 4
2016-11-18
我先有一个数据集是关于个人贷款的银行数据。
假设我取2016年10月31日为数据时点,现有数据里包括从2010年到2016年第三季度末每一个季度发放的贷款明细,如贷款金额,是否违约,违约本金等等

我的目标数据是每个贷款组(按季度分组)在数据时点的违约率。
比如计算2010年第一季度的违约率:
按季度估算的违约率: = (截止数据时点2010年第一季度贷款的违约本金总和)/(2010年第一季度贷款总额)

所以该计算公式由两个连续变量的商构成。

请问: 对于每一个季度的违约率或违约金额是否有合适的概率分布来建模。

我设想用Beta distribution来建模(假定每一个分组贷款的违约概率服从Beta Distribution),但我的concern是这个违约率是两个金额相除,而不是两个贷款个数的比率。如果是后者,对于一个分组的N个贷款,违约贷款的笔数服从二项分布。违约率就是分布参数p。当然这是假定分组里所有贷款独立同分布。(暂不讨论这个假设是否成立)。在贝叶斯模型里,常常用Beta 分布来假定p的分布。回到以上的违约率,对于这个计算形式的违约率是否也可以用Beta分布来假设?或者有更好的方法来建模?

敬请指教,不胜感激。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-11-18 06:38:51
感觉没什么问题。另外用Beta的原因除了它可以建模概率参数p外,还有一个原因是它是二项的共轭分布~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-11-18 06:49:32
foozhencheng 发表于 2016-11-18 06:38
感觉没什么问题。另外用Beta的原因除了它可以建模概率参数p外,还有一个原因是它是二项的共轭分布~
但思路上,如果目标数据是贷款笔数,那么违约笔数可服从二项分布,而违约率p可服从Beta 分布。 而现在目标数据是贷款金额。违约的本金金额是连续量,我不知有什么现有的连续分布可用来建模,而据此算出的违约率是否仍可以套用Beta? 也就是说,Beta分布可以适用广义的概率或比率的分布或者它只能适用基于二项分布的过程里的概率p?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-11-18 09:33:02
Dwight 发表于 2016-11-18 06:49
但思路上,如果目标数据是贷款笔数,那么违约笔数可服从二项分布,而违约率p可服从Beta 分布。 而现在目标 ...
可以认为总金额X为一个非负的连续随机变量,这样就可以考虑诸如Gamma、LogNormal之类的分布,同时违约率服从Beta分布。一个可以考虑的(其实也是非常漂亮的)模型是:定义X为违约资金量,Y为未违约的资金量,则U = X + Y为总资金量,W = X / (X + Y)为违约率。如果U ~ Gamma(\alpha + \beta, \lambda), W ~ Beta(\alpha, \beta)且U与W独立,那么X ~ Gamma(\alpha, \lambda), Y ~ Gamma(\beta, \lambda)且X与Y独立。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-11-18 09:43:11
用logistic回归不更好吗
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群