鉴于最近很多朋友,问起这个问题,我便自立门户,给大家讲一下,水平有限,欢迎指正!
关于多重共线性问题的影响、常见问题及其解决办法
一、多重共线性的影响:
当回归模型中两个或者两个以上的自变量彼此相关时,则称回归模型中存在多重共线性。多元线性回归模型涉及多个经济变量时,对于这些变量受相同经济环境的影响,存在共同的变化趋势,他们之间大多存在一定的相关性,这种相关因素是造成多重共线性的主要根源,另外,当模型中,存在自变量的滞后项时也容易引起多重共线性。多重共线性一般与时间序列有关.但在截面数据中也会出现。在多元线性回归模型中,我们关心的并不是多重共线性的有无,而是多重共线性的严重程度。当存在多重共线性的程度过高时,将会给估计带来严重的后果.
二、多重共线性的常见问题及其识别
在实际问题中,所使用的自变量之间存在相关是比较常见的事情,是在回归分析中存在多重共线性时将会产生某些问题。常见的问题如下:
1、参数估计值不精确,也不稳定。样本观测值稍微变化,增加或者减少解释变量等都会使参数估计值产生较大的变化。
2、t检验失效,区间估计失去意义;估计量的方差很大,相应标准差增大,进行检验时,接受零假设的可能性增大,从而舍去对被解释变量.
3、多重共线性的判别。多重共线性的判断方法有很多,专业的判断方法有方差扩大因子法、特征根分析法等。比较简单的方法:其一,计算模型中各对自变量之间的相关系数,井对各相关系数进行显著性检验。如果一个或者多个相关系数是显著的,就表示模型中所使用的自变量之间相关,因而存在多重共线性问题;其二,参数估计值的经济检验,考察参数最小二乘估计值的符号和大小、如果不符合经济理论或实际情况、说明模型,扣可能存在多重共线性;其三,参数估计值的稳定性,增加或减少解释变量、变动样本观测值,考察参数估计值的变化,如果变化明显。说明模型可能存在多重共线性;其四,参数估计值的统计检验,多元线性回归方程的R^2值较大,但是回归系数在统计上几一乎均不显著,说明存在多重共线性:下面通过实际案例主要介绍采用简单直观的方法进行判断多重共线性问题。
三、多重共线性问题的处理:
当通过某种检验,严重的多重共线性时,我们要设法消除这种共线性,
发现解释变量中存在消除共线性的方法有多种,包括:剔除一些不重要的解释变量;增加样本容量;回归系数的有偏估计等。比较简单常用的方法是剔除变量法,即将一个或者多个相关的自变量从模型中剔除,使保留的自变量尽可能不相关。
多重共线性问题带来的主要麻烦是对单个回归系数的解释与检验。在求因变蛋的置信区间与预测区间时一般不受影响,但必须保证用于估计或预测的自变量的值在样本数据的范围内。因此,如果仅仅是为了估计或者预测,可以将所有的自变龄都保留在模型中。最后,在建立多元线性回归模型时不要试图引人太多的自变量,除非确实有必要.