五、课程大纲
SAS程序基础篇
1、SAS总体概览
1.1 课程介绍
1.2 SAS系统介绍
1.3 SAS 模块介绍
1.4 SAS界面讲解
2、SAS 数据集
2.1 SAS数据集与逻辑库
2.2 直接创建数据:手动创建
2.3 间接获取数据:访问本地文件与数据库
3、SAS 语法
3.1 基本概念
3.2 语法规则
3.3 语法错误诊断与修正
4、SAS编程之data步——数据预分析
案例1:如何管理数据集
案例2:数据格式的排列组合
案例3:数据的纵向汇总
案例4:条件语句的设置
5、SAS编程之proc步——统计描述
5.1 平均数和标准差的意义
5.2 正态分布有多重要
5.3 数据标准化变换
5.4 缺失值填补
6、编程之proc步——统计推断
6.1 差异性分析
a.假设检验原理
b.t检验:判断组间差异
c.方差分析:判断多组间差异
d.协方差分析:存在协变量的群组差异
6.2 相关性分析
a.散点图提供了变量间的关系模式
b.变量关系的基础:pearson、spearman相关系数
c.偏相关分析
d.多变量相关性:典型相关
6.3 线性回归分析
a.简单回归分析
截距意义何在:数据平移
斜率反应预测关系的大小
b.多元回归分析
多元回归分析:回归概览性描述
处理异常值:残差分析
常用的对数变换
模型的可接受误差评析
哑变量变换
6.4 稳健的logistics回归
a.预分析:卡方独立性检验
b.构建模型与模型诊断、修正
c.自变量筛选与多模型评估:roc曲线
d.自变量的筛选:逐步回归
e.何谓稳健?
6.5 poisson 回归
a.poisson回归的诊断
b.贝叶斯poisson回归
6.6 稳健回归
a.稳健性之模型诊断
b.稳健性估计方法
c.稳健回归分析比较
6.7 主成分分析
a.多维偏好分析
b.探索性因子分析
c.问卷的结构效度指标
d.因子得分的应用:潜变量
6.8 对应分析
a.预分析:频数、交叉表与卡方
b.一元对应分析:行为与选择的对应特征
c.多元对应分析:维度的意义
6.9 联合分析
a.联合分析流程
b.析因设计与效应值计算
c.联合分析过程
7、数据挖掘(SAS/EM)
7.1统计模型与数据挖掘的区别:数据量、数据精确度、时间、关注点
7.2构建预测模型:购买倾向分析:基于回归、决策树、神经网络模型的预测