数据探索性分析过程除了可以计算基本的统计量外,也可以给出一些简单的检验结果和图形,有助于用户进一步的分析数据。
一、explore过程的参数设置
分析—描述—探索
图1
1变量列表:用于选入待分析的变量
2因变量列表:用于选择分组变量,根据该变量取值不同,分组分析因子变量列表中的变量。
3标注个案:选择标签变量。
4输出选项:定义输出结果
5统计量:
图2
描述性:就散一般的描述性统计量,输出均值、中位数等等。。。
M-估计值:描述集中趋势的统计量。
界外值:分别输出5个极大值和极小值
百分位数:输出变量5%,10%,25%,50%,75%,90%,95%分位数
6绘制:
图3
箱图:定义箱图的输出
描述性:定义是否输出茎叶图和直方图
带检验的正态图:检验正态
伸展与级别检验:用于比较各组之间的离散程度是否一致
7选项:
图4
用于设置缺失值的处理方法。
明天讲解explore的案例分析,操作和结果解析。