全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析师(CDA)专版
2207 0
2017-12-19

CDA数据分析就业班毕业答辩集锦

—金融数据分析


项目背景:
该数据为2009-2016年某商业银行中部分客户的基本交易情况,主要含交易信息,人口基本属性以及相关衍生变量,行方想根据既有信息,推出一款理财产品-'g基金',根据以上信息,行方通过这些信息,想知道那些客户是他们的目标客户。

解决方案:
此数据缺失值极多,数据不平衡,并且变量过多易陷入虚拟变量陷阱。因此首先采用欠采样将响应变量控制在1:5;然后使用随机森林和WOE算法进行变量筛选;最后填补缺失值处理异常值。之后应用logistic回归在训练组得出模型,再用测试组检验模型。

分析结果:
最后给出的模型AUC值适中,预测合理,模型比较稳健。同时,这是一个结构模型,可分析自变量的偏效应,更便于模型落地。

答辩视频

PS想要获取「答辩完整视频和PPT」,请加入QQ群:389385514,下载链接见群公告

作品优势:
1、在进行数据清洗的时候,参考了多篇学术文献,保证了清洗方法的严肃性与适用性。
2、在进行变量筛选的时候,结合了随机森林和WOE算法进行筛选,保证了筛选结果正确且可解释。
3、在预测阈值的确定与模型变量解释的问题上,更多地考虑了模型落地的问题,保证了模型可应用在实际业务中。

CDA数据分析就业班介绍:

   CDA数据分析就业班是为解决当下企业招人难、学员就业难的问题所研发的精品课程。课程以数据分析理论与实践案例结合的方式讲授,内容覆盖了国内企业招聘数据分析师岗位所需的技能,学员经过三个月系统全面的脱产学习(统计学、Excel、SQL、SPSS、SAS、R、Python),达到企业用人标准,快速在大数据时代找准工作定位。


课程详情:https://www.cda.cn/kecheng/6.html


快点加入我们,一起玩转数据分析吧!

联系方式:

电话:010-53605625

手机:18810531180(曹老师)

QQ:28819897062881989706

邮箱:caolibo@pinggu.org



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群