三.图
图可以帮助验证正态性、线性和方差相等的假设。对于检测离群值、异常观察值和有影响的个案,图也是有用的。在将它们保存为新变量之后,在数据编辑器中可以使用预测值、残差和其他诊断以使用自变量构造图。以下图是可用的:
散点图。您可以绘制以下各项中的任意两种:因变量、标准化预测值、标准化残差、剔除残差、调整预测值、Student 化的残差或 Student 化的已删除残差。针对标准化预测值绘制标准化残差,以检查线性关系和等方差性。
源变量列表. 列出因变量 (DEPENDNT) 及以下预测变量和残差变量:标准化预测值 (*ZPRED)、标准化残差 (*ZRESID)、剔除残差 (*DRESID)、调整的预测值 (*ADJPRED)、学生化的残差 (*SRESID) 以及学生化的已删除残差 (*SDRESID)。
生成所有部分图。当根据其余自变量分别对两个变量进行回归时,显示每个自变量残差和因变量残差的散点图。要生成部分图,方程中必须至少有两个自变量。
标准化残差图。您可以获取标准化残差的直方图和正态概率图,将标准化残差的分布与正态分布进行比较。
如果请求了任意图,则将显示标准化预测值和标准化残差(*ZPRED 和 *ZRESID)的摘要统计。
此功能需要 Statistics Base 选项。
从菜单中选择:
分析 > 回归 > 线性...
在“线性回归”对话框中,单击图。
对于散点图,选择一个垂直(y) 轴变量和一个水平 (x) 轴变量。要请求其他散点图,请单击下一步。
四.线性回归:保存新变量
您可以保存预测值、残差和其他对于诊断有用的统计量。每选择一次将向活动数据文件添加一个或多个新变量。
预测值。回归模型对每个个案预测的值。
• 未标准化. 模型为因变量预测的值。
• 标准化. 每个预测值转换为其标准化形式的转换。即,预测值减去均值预测值,得到的差除以预测值的标准差。标准化预测值的均值为 0,标准差为 1。
• 调节. 当某个案从回归系数的计算中排除时,个案的预测值。
• 均值预测值的 S.E.. 预测值的标准误。对于自变量具有相同值的个案所对应的因变量的均值的标准差的估计。
距离。标识以下个案的测量:自变量的值具有异常组合的个案,以及可能对回归模型产生很大影响的个案。
• Mahalanobis 距离. 自变量上个案的值与所有个案的平均值相异程度的测量。大的 Mahalanobis 距离表示个案在一个或多个自变量上具有极值。
• Cook 距离. 在特定个案从回归系数的计算中排除的情况下,所有个案的残差变化幅度的测量。较大的 Cook 距离表明从回归统计量的计算中排除个案之后,系数会发生根本变化。
•杠杆值. 度量某个点对回归拟合的影响。集中的杠杆值范围为从 0(对拟合无影响)到 (N-1)/N。
预测区间。均值和个别预测区间的上界和下界。
•均值. 平均预测响应的预测区间的下限和上限(两个变量)。
•单值. 单个个案的因变量预测区间的下限和上限(两个变量)。
•置信区间. 输入 1 到 99.99 之间的值,以指定两个预测区间的置信度。在输入此值之前必须选择“均值”或“区间”。典型的置信区间值为 90、95 和 99。
残差。因变量的实际值减去按回归方程预测的值。
•未标准化. 观察值与模型预测值之间的差。
•标准化. 残差除以其标准差的估计。标准化残差也称为 Pearson 残差,它的均值为 0,标准差为 1。
•学生化. 残差除以其随个案变化的标准差的估计,这取决于每个个案的自变量值与自变量均值之间的距离。
•删除. 当某个案从回归系数的计算中排除时,该个案的残差。它是因变量的值和调整预测值之间的差。
•学生化已删除. 个案的剔除残差除以其标准误。Student 化的剔除残差与其相关联的学生化的残差之间的差分指示去除某个个案对其预测产生的差分。
影响统计量。由于排除了特定个案而导致的回归系数 (DfBeta) 和预测值 (DfFit) 的变化。标准化 DfBeta 和 DfFit 值也可与协方差比率一起使用。
• DfBeta(s). beta 值的差分是由于排除了某个特定个案而导致的回归系数的改变。为模型中的每一项(包括常数项)均计算一个值。
•标准化 DfBeta. beta 值的标准化差分。由于排除了某个特定个案而导致的回归系数的改变。您可能想要检查除以 N 的平方根之后绝对值大于 2 的个案,其中 N 是个案数。为模型中的每一项(包括常数项)均计算一个值。
• DfFit. 拟合值的差分是由于排除了某个特定个案而产生的预测变量的更改。
•标准化 DfFit. 拟合值的标准化差分。由于排除了某个特定个案而导致的预测值的改变。您可能想要检查绝对值大于 p/N 的平方根的 2 倍的标准化值,其中 p 是模型中的参数个数,N 是个案数。
•协方差比率. 从回归系数计算中排除特定个案的协方差矩阵的行列式与包含所有个案的协方差矩阵的行列式的比率。如果比率接近 1,则说明被排除的个案不能显著改变协方差矩阵。
系数统计。将回归系数保存到数据集或数据文件。可以在同一会话中继续使用数据集,但不会将其另存为文件,除非在会话结束之前明确将其保存为文件。数据集名称必须符合变量命名规则。
将模型信息输出到 XML 文件。将参数估计值及其(可选)协方差导出到指定的 XML (PMML) 格式的文件。您可以使用该模型文件以应用模型信息到其他数据文件用于评分目的。
此功能需要 Statistics Base 选项。
从菜单中选择:
分析 > 回归 > 线性...
在“线性回归”对话框中,单击保存。
选择需要的值或统计量。