全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件
1512 0
2020-12-06
简介

上一节,我们研究了回归模型的线性定义,假设条件,参数估计,以及基于统计学检验的模型评价。但是这并不是意味着我们的回归模型以及可以投入使用,进行决策了。我们还需要在计量经济学的基础上验证模型,当模型出现多重共线性、异方差、序列相关等等问题时,我们需要如何应对与处理。

接下来我们来分别针对不同的情况看进行处理

正文一,异方差(Heteroscedasticity)

(一) 异方差的介绍

在线性回归模型中,我们假定残差项是同方差的,如果该假定明显背离真实值,则
残差的正态分布假设也将失效。因此通常带来一些问题:

  • 参数估计的有效性和渐近线失效
  • 参数的显著性检验实效
  • 回归方程应用效果极不理想

(二) 异方差的诊断

1,图示法
构建残差图 Y-e

2,假设检验

(1)Halbort White检验

如果存在异方差,说明回归残差项与解释变量X存在某些形式的联系
那么用残差平方对解释变量X,以及解释变量的平方项、交叉乘积项构建辅助回归模型,如果辅助模型显著,则说明存在异方差问题

检验思想

  • 假设对于二元回归模型有y i = β 0 + β 1 x 1 + β 2 x 2 + ϵ i y_i=β_0+β_1x_1+β_2x_2+\epsilon_iyi​=β0​+β1​x1​+β2​x2​+ϵi​
  • 辅助回归模型ϵ i 2 = α 0 + α 1 x 1 + α 2 x 2 + α 3 x 1 2 + α 4 x 2 2 + + α 5 x 1 x 2 + v i \epsilon_i^2=α_0+α_1x_1+α_2x_2+α_3x_1^2+α_4x_2^2++α_5x_1x_2+v_iϵi2​=α0​+α1​x1​+α2​x2​+α3​x12​+α4​x22​++α5​x1​x2​+vi​
  • 根据辅助模型建立方差分析F统计量
  • F统计量如果拒绝原假设(H 0 : α 1 = α 2 = . . . = α k = 0 H_0:α_1=α_2=...=α_k=0H0​:α1​=α2​=...=αk​=0),则说明存在异方差

(2)Breush Pagan 检验

检验思想与White检验基本相似,辅助回归模型不同

  • 运用OLS估计回归方程y i = β 0 + β 1 x 1 . . . + + β k x k + ϵ i y_i=β_0+β_1x_1...++β_kx_k+\epsilon_iyi​=β0​+β1​x1​...++βk​xk​+ϵi​
  • 根据得到的残差项构建辅助回归模型ϵ i 2 = α 0 + α 1 x 1 . . . + + α k x k + v i \epsilon_i^2=α_0+α_1x_1...++α_kx_k+v_iϵi2​=α0​+α1​x1​...++αk​xk​+vi​
  • 根据辅助模型建立方差分析F统计量
  • F统计量如果拒绝原假设(H 0 : α 1 = α 2 = . . . = α k = 0 H_0:α_1=α_2=...=α_k=0H0​:α1​=α2​=...=αk​=0),则说明存在异方差

(3)同理,我们可以根据构建不同形式的辅助回归模型,通过其F检验来判断是否存在不同形式的异方差问题

(三) 异方差的处理

加权最小二乘法WLS

我们令w i = 1 / σ i 2 w_i = 1/\sigma^{2}_{i}wi​=1/σi2​,构建下面对角矩阵

W = ( w 1 0 … 0 0 w 2 … 0 ⋮ ⋮ ⋱ ⋮ 0 0 … w n ) \textbf{W}=\left(

w10⋮0amp;0amp;w2amp;⋮amp;0amp;…amp;…amp;⋱amp;…amp;0amp;0amp;⋮amp;wnw1amp;0amp;…amp;00amp;w2amp;…amp;0⋮amp;⋮amp;⋱amp;⋮0amp;0amp;…amp;wn


\right)W=⎝⎜⎜⎜⎛​w1​0⋮0​0w2​⋮0​……⋱…​00⋮wn​​⎠⎟⎟⎟⎞​

W Y = W X β + W ϵ \textbf{W}Y=\textbf{W}Xβ+\textbf{W}\epsilonWY=WXβ+Wϵ

Y ∗ = W Y Y^*=\textbf{W}YY∗=WY
X ∗ = W X β X^*=\textbf{W}XβX∗=WXβ
ϵ ∗ = W ϵ \epsilon^*=\textbf{W}\epsilonϵ∗=Wϵ

则,WLS结果如下:

β ^ W L S = arg ⁡ min ⁡ β ∑ i = 1 n ϵ i ∗ 2 = ( X T WX ) − 1 X T WY \hat{\beta}_{WLS}=\arg\min_{\beta}\sum_{i=1}^{n}\epsilon_{i}^{*2}\\ =(\textbf{X}^{T}\textbf{W}\textbf{X})^{-1}\textbf{X}^{T}\textbf{W}\textbf{Y}β^​WLS​=argminβ​∑i=1n​ϵi∗2​=(XTWX)−1XTWY

二,多重共线性

(一) 多重共线性的介绍

多重共线性有两种

  • 基于结构共线性:数学效应引起的,比如解释变量有X , X 2 , X 3 X,X^2,X^3X,X2,X3导致的
  • 基于数据的共线性:不同变量的数据之间存在隐含的联系导致的

(二) 多重共线性的诊断

1,相关矩阵

2,方差扩大化因子(variance inflation factors ,VIF)

V I F k = 1 1 − R k 2 VIF_k=\frac{1}{1-R_{k}^{2}}VIFk​=1−Rk2​1​

VIF>10就认为存在多重共线性

(三) 多重共线性的处理

1,基于数据的共线性:增加样本数据,看是否能减少变量之间的相关性
2,基于结构的共线性:尝试将数据中心化
3,去掉部分变量
4,提取主成分

三,序列相关

(一) 序列相关的介绍

序列相关问题,与时间序列的自回归相似。

一个AR(2)的自回归模型如下:
y t = β 0 + β 1 y t − 1 + β 2 y t − 2 + ϵ t y_{t}=\beta_{0}+\beta_{1}y_{t-1}+\beta_{2}y_{t-2}+\epsilon_{t}yt​=β0​+β1​yt−1​+β2​yt−2​+ϵt​

同理如果回归方程中没有被选中的变量是有序列相关的,那么可能导致残差项产生序列相关的问题。

ϵ t = ρ ϵ t − 1 + ω t \epsilon_{t}=\rho\epsilon_{t-1}+\omega_{t}ϵt​=ρϵt−1​+ωt​
如果ρ \rhoρ显著,则说明存在序列相关的问题

(二) 序列相关的诊断

1,图示法e t , e t − 1 e_t,e_{t-1}et​,et−1​
2,回归检验法

如果残差回归的系数显著,则说明存在序列相关的问题
μ i = ρ 1 μ i − 1 + ρ 2 μ i − 2 + . . . + ρ l μ i − l + ϵ i μ_i=\rho_1μ_{i-1}+\rho_2μ_{i-2}+...+\rho_lμ_{i-l}+\epsilon_iμi​=ρ1​μi−1​+ρ2​μi−2​+...+ρl​μi−l​+ϵi​

3,D-W检验 (Durbin-Watson Test)

针对方程
ϵ t = ρ ϵ t − 1 + ω t \epsilon_{t}=\rho\epsilon_{t-1}+\omega_{t}ϵt​=ρϵt−1​+ωt​

假设检验
H 0 : ρ = 0 H A : ρ ≠ 0 H_{0}: \rho=0 \\ H_{A}: \rho\neq 0H0​:ρ=0HA​:ρ̸​=0

构造统计量
D = ∑ t = 2 n ( e t − e t − 1 ) 2 ∑ t = 1 n e t 2 D=\frac{\sum_{t=2}^{n}(e_{t}-e_{t-1})^{2}}{\sum_{t=1}^{n}e_{t}^{2}}D=∑t=1n​et2​∑t=2n​(et​−et−1​)2​

D的统计值在0-4之间

[color=rgba(0, 0, 0, 0.75)]D024
P10-1

只适合于一阶情形
不适用于同时存在异方差和序列相关模型

2,Ljung-Box Q Test

H 0 : k 个 滞 后 期 的 自 相 关 系 数 都 是 0 H_0: k个滞后期的自相关系数都是0H0​:k个滞后期的自相关系数都是0
H 1 : k 个 滞 后 期 的 自 相 关 系 数 不 都 是 0 H_1: k个滞后期的自相关系数不都是0H1​:k个滞后期的自相关系数不都是0

Q k = n ( n + 2 ) ∑ j = 1 k r j 2 n − j Q_{k}=n(n+2)\sum_{j=1}^{k}\frac{{r}^{2}_{j}}{n-j}Qk​=n(n+2)∑j=1k​n−jrj2​​

Q k 服 从 χ k 2 分 布 Q_{k}服从\chi^{2}_{k}分布Qk​服从χk2​分布

(三) 序列相关的处理

1,广义差分

如果残差存在一阶序列相关,则可以把数据进行一阶差分,然后再进行OLS估计
当然可以推广到广义差分:
如果原模型存在
μ i = ρ 1 μ i − 1 + ρ 2 μ i − 2 + . . . + ρ l μ i − l + ϵ i μ_i=\rho_1μ_{i-1}+\rho_2μ_{i-2}+...+\rho_lμ_{i-l}+\epsilon_iμi​=ρ1​μi−1​+ρ2​μi−2​+...+ρl​μi−l​+ϵi​

则广义差分回归模型为:
y i − ρ 1 y i − 1 − ρ 2 y i − 2 − . . . − ρ l y i − l = β 0 ( 1 − ρ 1 − ρ 2 − . . . − ρ l ) + β 1 ( X 1 − ρ 1 X 1 − ρ 2 X 2 − . . . − ρ l X l ) + . . + ϵ i y_i-\rho_1y_{i-1}-\rho_2y_{i-2}-...-\rho_ly_{i-l}=β_0(1-\rho_1-\rho_2-...-\rho_l)+β_1(X_1-\rho_1X_1-\rho_2X_2-...-\rho_lX_l)+..+\epsilon_iyi​−ρ1​yi−1​−ρ2​yi−2​−...−ρl​yi−l​=β0​(1−ρ1​−ρ2​−...−ρl​)+β1​(X1​−ρ1​X1​−ρ2​X2​−...−ρl​Xl​)+..+ϵi​

根据广义差分模型估计得到的参数,可以解决所有类型的自相关问题。

备注:广义差分需要得到具体的ρ i \rho_iρi​值

2,Cochrane-Orcutt迭代法

(1)先估计出回归模型的参数Y = β X + μ Y=βX+μY=βX+μ
(2)再估计出μ i = ρ 1 μ i − 1 + ρ 2 μ i − 2 + . . . + ρ l μ i − l + ϵ i μ_i=\rho_1μ_{i-1}+\rho_2μ_{i-2}+...+\rho_lμ_{i-l}+\epsilon_iμi​=ρ1​μi−1​+ρ2​μi−2​+...+ρl​μi−l​+ϵi​的参数ρ i \rho_iρi​
(3)代入广义差分模型
(4)重复上面的步骤直到第二步的ρ i \rho_iρi​不在显著或相邻两次迭代的数值差异小于某个精度时,终止循环
(5)一般迭代两次即可,所以又叫Cochrane-Orcutt两步法



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群