第一天上午 |
第1章:数据挖掘知识入门 SAS BASE、EM和SPSS Modeler对比介绍
|
第2章:信用风险建模简介 2.1 业务理解 2.2 维度分析、信息收集与变量生成 2.3 模型优劣评估标准 2.3.1 诚实评估的原则 2.3.2 数据抽样
|
第3章:SAS EM界面和数据文件介绍 3.1 SEMMA流程与EM界面功能排布 3.2 SAS EM的数据文件和文件夹
|
第4章:分类模型介绍 4.1 分类模型的3种运用场景 4.2 构造决策树模型实例 4.3 最优化模型的复杂度
|
第一天下午:
|
第5章:单变量检验与数据清洗 5.1 缺失值检验与处理方法 5.2 异常值检验与处理方法 5.3 解释变量粗筛——如何从一万个变量压缩到一百个变量 5.3.1 双变量关系检验法——变量选择节点 5.3.2 数据分箱 5.3.3 决策树法
|
第6章:维度压缩 6.1 连续变量压缩技术 6.1.1 因子分析 6.1.2 变量聚类 6.2 分类变量压缩技术 6.2.1 似完整分类数据问题 6.2.2 聚类法 6.2.3 WOE方法
|
第二天上午:
|
第7章:逻辑回归建模技术 7.1 算法 7.2 模型选择 7.2.1 逐步法 7.2.2 全子集法 7.3 根据经验Logit曲线进行连续变量转换
|
第8章:神经网络建模技术 8.1 算法 8.2 模型选择 8.3 控制模型复杂度
|
第二天下午:
|
第9章:模型评估与验证 9.1 诚实评估的原则 9.2 提升度与累积提升度 9.3 ROC曲线与曲线下面积 9.4 K-S统计量 9.5 基尼系数
|
第10章:构造信用评分卡专题 10.1 为什么采用逻辑回归建模 10.2 连续变量分箱技术与WOE转换 10.3 信用评分卡分值转换 10.4 阀值设置
|