回归分析与相关分析
相关分析研究的是现象之间是否相关、相关的方向和密切程度,一般不区别自变量或因变量。而回归分析则要分析现象之间相关的具
体形式,确定其因果关系,并用数学模型来表现其具体关系。
回归分析应用:
1、结构分析(弹性分析、乘数分析和比较静力分析)
2、经济预测
3、政策评价(经济政策实验室)
4、检验与发展经济理论。
经典计量经济学模型特征:
(1)模型类型→随机模型;
(2)模型向导→经济理论;
(3)模型结构→线性或可化为线性;
(4)数据类型→时间序列数据或截面数据;
(5)估计方法→最小二乘法或最大似然法。
计量经济学模型检验:
(1)经济意义检验:参数估计量的符号、大小和相互之间关系的合理性;
(2)统计检验:拟合优度检验(R2)、变量(t检验)和方程(F检验)的显著性检验;
(3)计量经济学检验:随机干扰性的序列相关性检验和异方差性检验,解释变量的多重共线性检验;
(4)模型预测检验:参数估计量的稳定性,相对样本容量变化时的灵敏度,超样本特性。
计量经济学方法论基础——回归分析,主要内容包括:
(1)根据样本观察值对计量经济学模型参数进行估计,求得回归方程;
(2)对回归方程、参数估计值进行显著性检验;
(3)利用回归方程进行分析、评价及预测。
回归模型数学形式:
回归模型 |
解释成分
|
常数项
|
解释变量
|
解释变量 滞后项
|
被解释变量 滞后项
|
随机干扰项 滞后项
|
随机干扰项
|
一般模型
|
√
|
√
|
|
|
|
√
|
随机干扰项 自回归模型 (广义差分模型 修正序列相关性)
|
√
|
√
|
|
|
√
|
√
|
分布滞后模型
|
√
|
√
|
√
|
|
|
√
|
自回归模型
|
√
|
√
|
|
√
|
|
√
|
时间序列模型
|
√
|
|
|
√
|
|
√
|
回归模型基本假设:
假设1:解释变量是确定性变量,不是随机变量,在重复抽样中取固定值,且相互之间互不相关(无多重共线性)。
假设2:随机干扰项具有零均值,同方差及不序列相关性,即:
假设3:随机干扰项与解释变量之间不相关,即:
假设4:随机干扰项服从零均值,同方差,零协方差的正态分布,即:
假设5:样本容量趋于无穷时,各解释变量的方差趋于有界常数,即:

假设6:回归模型是正确设定的。
最小二乘法:

参数估计量性质:
(1)线性性:即它是否是另一个随机变量的线性函数;
(2)无偏性:即他的均值或期望是否等于总体的真实值;
(3)有效性:即它是否在所有线性无偏估计量中具有最小方差;
(4)渐进无偏性:即样本容量趋于无穷大时,它的均值序列趋于总体均值;
(5)一致性:样本容量趋于无穷大时,它是否依概率收敛于总体的真值;
(6)渐进有效性:即样本容量趋于无穷大时,它在所有的一致估计量中具有最小的渐近方差。
前三个准则称作估计量的小样本性质(Small-sample properties),拥有这类性质的估计量称为最佳线性无偏估计量(Best linear unbiased estimator,BLUE)。普通最小二乘估计量具有线行性、无偏性和最小方差性等优良性质,是最佳线性无偏估计量,这就是著名的高斯-马尔科夫定理(Gauss-Markov Theorem)。
后三个准则称为估计量的大样本或渐进性质(Large-sample or Asymptotic properties)。如果小样本情况下不能满足估计的准则,则应扩大样本容量,考察参数估计量的大样本性质。
放宽基本假定模型:
基本假定违背 |
常见表现
|
检验方法
|
修正方法
|
异方差性 (Heteroscedasticity)
|
常见截面数据样本: 随机干扰项方差与 解释变量相关
参数估计量非有效
|
图示检验法; 帕克检验与 戈里瑟检验; G-Q检验; 怀特检验
|
加权最小二乘法(WLS)
|
序列相关性 (Serial correlation)
|
常见时间序列样本: 随机干扰项之间相关
参数估计量非有效
|
图示法; 回归检验法; D.W.检验法; 拉格朗日乘数检验
|
广义最小二乘法(GLS); 广义差分法
|
多重共线性 (Multicollinearity)
|
常见时间序列样本: 解释变量之间相关
参数估计量方差变大
|
判定系数检验法; 逐步回归检验法
|
排除引起共线性的变量; 差分法; 减小参数估计量的方差
|
随机解释变量问题 (Stochastic explanatory variables)
|
常见滞后被解释变量 作解释变量的模型: 存在随机解释变量; 随机解释变量与 随机干扰项异期相关; 随机解释变量与 随机干扰项同期相关
|
——
|
增大样本容量; 工具变量法
|
除此之外,还有模型设定有偏误和解释变量的方差随着样本容量的增加而不断增加这两类基本假定的违背。
模型设定偏误问题:

约化建模理论:
1、传统建模理论与数据挖掘问题
传统计量经济学的主导建模理论是“结构模型方法论”,这种理论以先验给定的经济理论为建立模型的出发点,以模型参数的估计值为重点,以参数估计值与其理论预期值相一致为判断标准,进行着一个“从简单到复杂”的建模过程(Simple-to-general approach)。这种模型方法往往以一个简单的模型为起点,该模型只包含按照已有的经济理论或先验假设而选择的少数被认为最主要的变量,然后对其进行估计与检验,如果检验结果“令人满意”,如有着较高的拟合优度、显著的t检验与F检验、较低程度的异方差性与序列相关性等,就将它作为最终模型;否则,增加新的变量,再进行估计与检验,直到得到一个复杂的最终模型。
传统的建模方法却有着某些固有的缺陷:
(1)数据挖掘(Data mining)问题:传统建模过程,往往是对不同变量及其数据的尝试与筛选过程,即所谓的数据挖掘,然而这一过程却对我们所最终选择的变量的t检验产生较大影响。变量的显著性检验是对模型是否最终选择某变量的主要判断标准,然而当我们在众多备选变量中选择变量进入模型时,其中t检验的真实的显著性水平已不再是我们事先给定的名义显著性水平;
(2)随意性:对同一研究对象,使用同一数据,但不同的建模者往往得出不同的最终模型。
2、约化建模理论——“从一般到简单”
约化建模理论认为,在模型的最初设定上,就设立一个“一般”的模型,包括了所有先验经济理论与假设中所有应包括的全部变量,各种可能的“简单”模型都被“嵌套”(Nested)在这个“一般”的模型之中。然后在模型的估计过程中逐渐剔除不显著的变量,最后得到一个较“简单”的最终模型。这就是所谓的“从一般到简单”(General-to-specific)的建模理论。
约化建模理论提出了一个对不同先验假设的更为系统的检验程序。同时由于它的初始模型就是一个包括所有可能变量的“一般”模型,也就避免了过度的“数据挖掘”问题。另外,由于初始模型的“一般”性,所有研究者的“起点”都是相同的,因此,在相同的约化程序下,最后得到的最终模型也应该是相同的。
时间序列平稳性、单整和协整:
经典计量经济学模型对时间序列的分析是通过建立因果关系为基础的结构模型进行的,而无论是单方程计量经济学模型还是联立方程计量经济学模型,这种分析背后有一个隐含的假设,即这些数据是平稳的。否则的话,通常的t、F等假设检验则不可信。在经典回归分析中,通过假设样本观测点趋于无穷时,解释变量的X的方差趋于有界常数,给出了X平稳性的一个重要条件,这样,既为大样本下的统计推断奠定了基础,也使得所考虑的时间序列更靠近平稳性这一假设。
而现实中许多经济变量是非平稳的,即它们是一阶或高阶的单整时间序列。但非平稳的时间序列,它们的线性组合也可能成为平稳的。如假设均衡关系式中的X与Y是I(1)序列,如果该式所描述的它们之间长期均衡关系成立的话,则意味着由非均衡误差式给出的线性组合是I(0)序列,这时我们称变量X与Y是协整的。所谓协整关系可理解为两变量间具有长期的稳定关系。
从协整的定义可以看出,(d,b)阶协整是一类非常重要的协整关系,它的经济意义在于:两个变量,虽然它们具有各自的长期波动规律,但是如果它们是(d,b)阶协整的,则他们之间存在着一个长期稳定的比例关系。这也解释了尽管两个时间序列是非平稳的,但却可以用经典的回归分析方法建立因果关系回归模型的原因。
from:
http://lijiwei19850620.blog.163. ... 153820121114239337/