离群点:指那些模型预测效果不佳的观测点。通常有很大的、或正或负的残差。可用car包的outlierTest()函数求得最大标准化残差绝对值Bonferroni调整后的p值,从而作出判断。
高杠杆值:即是与其他预测变量有关的离群点。换句话说,它们是由许多异常的预测变量值组合起来的,与响应变量值没有关系。可通过帽子统计量(hat statistic)判断。
强影响点:即对模型参数估计值影响有些比例失衡的点。例如,若移除模型的一个观测点时,模型会发生巨大的改变,那么你就需要检测一下数据中是否存在强影响点了。有两种方法可进行检测:Cook距离法(D统计量),以及变量添加图。