全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
5865 8
2015-05-27
悬赏 100 个论坛币 已解决
我有一组样本数据,此处截出部分数据:

我要考察的是第4个字段即违约与年龄的关系,我想根据违约情况对年龄先进行一个分段,请问该如何进行分段或者我第一步该做什么?谢谢好心人。


附上使用proc univariate var age的数据:

最佳答案

WUPUQU 查看完整内容

1.如果真的太离散,木有办法拆分,那就直接当做一组咯。以你给的数据为例:26,56-59,60-以上明显是可以作为一组的,其他的年龄可以就当做一组,不再拆分。 其实这里还要看各年龄的人数占比。如果占比大,违约比例特殊,也可以单独作为一组进行研究。 PS:其实可以直接利用统计工具进行最优分箱
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-5-27 09:49:03
softache 发表于 2015-6-2 11:38
谢谢您的回复,但是如果年龄和违约率之间比较离散,那又该如何划分呢?
1.如果真的太离散,木有办法拆分,那就直接当做一组咯。以你给的数据为例:26,56-59,60-以上明显是可以作为一组的,其他的年龄可以就当做一组,不再拆分。
其实这里还要看各年龄的人数占比。如果占比大,违约比例特殊,也可以单独作为一组进行研究。

PS:其实可以直接利用统计工具进行最优分箱
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-5-27 10:18:37
我们以前的做法是查资料和绘制散点图分析。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-5-27 18:54:39
1.先统计每个年龄的违约人数,计算违约比例
2.画图看“年龄*违约比例”分布,或者直接根据违约比例数据,将比较接近的年龄划为一组
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-5-28 22:18:52
你可以划分区间,利用WOE的方法进行年龄分组。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-6-2 09:39:10
wodematlab 发表于 2015-5-28 22:18
你可以划分区间,利用WOE的方法进行年龄分组。。
谢谢您的回复,但正是因为第一步区间不知道该怎么划,如果随意去划的话也无依据。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群