识别问题:具有非常高的R-sq,但是显著性很低;符号不合常理的相反;标准差非常大;进出一个变量带来的变化非常大。一般具有这四个现象之一,就要怀疑,具有两个现象以上,要认真处理。
处理方法主要是删除变量,根据是条件数、vif、F值和偏相关系数。但最简单有效的方法是stata中的vif,如果最大的vif超过10或者平均vif大于1,基本可以肯定存在共线性。
复杂一点的方法是逐步回归法,但stata中不是每个命令都有逐步回归选项,因此可以自己编程,如果不想编,就手动删除变量,直到结果满意为止。变量进出模型的标准可以是F值、信息准则,反正选一个就可以。