计量经济学如何学习_计量经济学第三版课后答
计量经济学中级教程习题参考答案
第一章 绪论
1.1 一般说来,计量经济分析按照以下步骤进行:
(1)陈述理论(或假说) (2)建立计量经济模型 (3)收集数据
(4)估计参数 (5)假设检验 (6)预测和政策分析
1.2 我们在计量经济模型中列出了影响因变量的解释变量,但它(它们)仅是影响因变量的主要因素,还有很多对因变量有影响的因素,它们相对而言不那么重要,因而未被包括在模型中。为了使模型更现实,我们有必要在模型中引进扰动项u来代表所有影响因变量的其它因素,这些因素包括相对而言不重要因而未被引入模型的变量,以及纯粹的随机因素。
1.3 时间序列数据
时间序列数据是按时间周期(即按固定的时间间隔)收集的数据,如年度或季度的国民生产总值、就业、货币供给、财政赤字或某人一生中每年的收入都是时间序列的例子。
横截面数据是在同一时点收集的不同个体(如个人、公司、国家等)的数据。如人口普查数据、世界各国2000年国民生产总值、全班学生计量经济学成绩等都是横截面数据的例子。
1.4 估计量是指一个公式或方法,它告诉人们怎样用手中样本所提供的信息去估计总体参数。在一项应用中,依据估计量算出的一个具体的数值,称为估计值。如 就是一个估计量, 。现有一样本,共4个数,100,104,96,130,则根据这个样本的数据运用均值估计量得出的均值估计值为 。
第二章 经典线性回归模型
2.1 判断题(说明对错;如果错误,则予以更正)
(1)对
(2)对
(3)错
只要线性回归模型满足假设条件(1)~(4),OLS估计量就是BLUE。
(4)错
R2 =ESS/TSS。
(5)错。我们可以说的是,手头的数据不允许我们拒绝原假设。
(6)错。因为 ,只有当 保持恒定时,上述说法才正确。
2.2 应采用(1),因为由(2)和(3)的回归结果可知,除X1外,其余解释变量的系数均不显著。(检验过程略)
2.3 (1) 斜率系数含义如下:
0.273: 年净收益的土地投入弹性, 即土地投入每上升1%, 资金投入不变的情况下, 引起年净收益上升0.273%.
733: 年净收益的资金投入弹性, 即资金投入每上升1%, 土地投入不变的情况下, 引起年净收益上升0.733%.
拟合情况: ,表明模型拟合程度较高.
(2) 原假设
备择假设
检验统计量
查表, 因为t=2.022< ,故接受原假设,即 不显著异于0, 表明土地投入变动对年净收益变动没有显著的影响.
原假设
备择假设
检验统计量
查表, 因为t=5.864> ,故拒绝原假设,即β显著异于0,表明资金投入变动对年净收益变动有显著的影响.
(3) 原假设
备择假设 : 原假设不成立
检验统计量
查表,在5%显著水平下 因为F=47>5.14,故拒绝原假设。
结论,:土地投入和资金投入变动作为一个整体对年净收益变动有影响.
2.4 检验两个时期是否有显著结构变化,可分别检验方程中D和D•X的系数是否显著异于0.
(1) 原假设 备择假设
检验统计量
查表 因为t=3.155> , 故拒绝原假设, 即 显著异于0。
(2) 原假设 备择假设
检验统计量
查表 因为|t|=3.155> , 故拒绝原假设, 即 显著异于0。
结论:两个时期有显著的结构性变化。
2.5 (1)
(2)变量、参数皆非线性,无法将模型转化为线性模型。
(3)变量、参数皆非线性,但可转化为线性模型。
取倒数得:
把1移到左边,取对数为: ,令
2.6 (1)截距项为-58.9,在此没有什么意义。X1的系数表明在其它条件不变时,个人年消费量增加1百万美元,某国对进口的需求平均增加20万美元。X2的系数表明在其它条件不变时,进口商品与国内商品的比价增加1单位,某国对进口的需求平均减少10万美元。
(2)Y的总变差中被回归方程解释的部分为96%,未被回归方程解释的部分为4%。
(3)检验全部斜率系数均为0的原假设。
=
由于F=192 > F0.05(2,16)=3.63,故拒绝原假设,回归方程很好地解释了应变量Y。
(4) A. 原假设H0:β1= 0 备择假设H1:β1 10
> t0.025(16)=2.12,
故拒绝原假设,β1显著异于零,说明个人消费支出(X1)对进口需求有解释作用,这个变量应该留在模型中。
B. 原假设H0:β2=0 备择假设H1:β2 10
<t0.025(16)=2.12,
不能拒绝原假设,接受β2=0,说明进口商品与国内商品的比价(X2)对进口需求地解释作用不强,这个变量是否应该留在模型中,需进一步研究。
2.7(1)弹性为-1.34,它统计上异于0,因为在弹性系数真值为0的原假设下的t值为:
得到这样一个t值的概率(P值)极低。可是,该弹性系数不显著异于-1,因为在弹性真值为-1的原假设下,t值为:
这个t值在统计上是不显著的。
(2)收入弹性虽然为正,但并非统计上异于0,因为t值小于1( )。
(3)由 ,可推出
本题中, =0.27,n=46,k=2,代入上式,得 =0.3026。
2.8(1)薪金和每个解释变量之间应是正相关的,因而各解释变量系数都应为正,估计结果确实如此。
系数0.280的含义是,其它变量不变的情况下,CEO薪金关于销售额的弹性为0.28%;
系数0.0174的含义是,其它变量不变的情况下,如果股本收益率上升一个百分点(注意,不是1%),CEO薪金的上升约为1.07%;
与此类似,其它变量不变的情况下,公司股票收益上升一个单位,CEO薪金上升0.024%。
(2)用回归结果中的各系数估计值分别除以相应的标准误差,得到4个系数的t值分别为:13.5、8、4.25和0.44。用经验法则容易看出,前三个系数是统计上高度显著的,而最后一个是不显著的。
(3)R2=0.283,拟合不理想,即便是横截面数据,也不理想。
2.9 (1)2.4%。
(2)因为Dt和(Dt×t)的系数都是高度显著的,因而两时期人口的水平和增长率都不相同。1972-1977年间增长率为1.5%,1978-1992年间增长率为2.6%(=1.5%+1.1%)。
2.10 原假设H0: β1 =β2,β3 =1.0
备择假设H1: H0不成立
若H0成立,则正确的模型是:
据此进行有约束回归,得到残差平方和 。
若H1为真,则正确的模型是原模型:
据此进行无约束回归(全回归),得到残差平方和S。
检验统计量是:
~F(g,n-K-1)
用自由度(2,n-3-1)查F分布表,5%显著性水平下,得到FC ,
如果F< FC, 则接受原假设H0,即β1 =β2,β3 =0;
如果F> FC, 则拒绝原假设H0,接受备择假设H1。
2.11 (1)2个,
(2)4个,
2.12
2.13 对数据处理如下:
lngdp=ln(gdp/p) lnk=ln(k/p) lnL=ln(L/P)
对模型两边取对数,则有
lnY=lnA+alnK+blnL+lnv
用处理后的数据采用EViews回归,结果如下:
t:(-0.95) (16.46) (3.13)
由修正决定系数可知,方程的拟合程度很高;资本和劳动力的斜率系数均显著(tc=2.048), 资本投入增加1%,gdp增加0.96%,劳动投入增加1%,gdp增加0.18%,产出的资本弹性是产出的劳动弹性的5.33倍。
第三章 经典假设条件不满足时的问题与对策
3.1
(1)对
(2)对
(3)错
即使解释变量两两之间的相关系数都低,也不能排除存在多重共线性的可能性。
(4)对
(5)错
在扰动项自相关的情况下OLS估计量仍为无偏估计量,但不再具有最小方差的性质,即不是BLUE。
(6)对
(7)错
模型中包括无关的解释变量,参数估计量仍无偏,但会增大估计量的方差,即增大误差。
(8)错。
在多重共线性的情况下,尽管全部“斜率”系数各自经t检验都不显著, R2值仍可能高。
(9)错。
存在异方差的情况下,OLS法通常会高估系数估计量的标准误差,但不总是。
(10)错。
异方差性是关于扰动项的方差,而不是关于解释变量的方差。
3.2 对模型两边取对数,有
lnYt=lnY0+t*ln(1+r)+lnut ,
令LY=lnYt,a=lnY0,b=ln(1+r),v=lnut,模型线性化为:
LY=a+bt+v
估计出b之后,就可以求出样本期内的年均增长率r了。
3.3(1)DW=0.81,查表(n=21,k=3,α=5%)得dL=1.026。
DW=0.81<1.026
结论:存在正自相关。
(2)DW=2.25,则DW′=4 – 2.25 = 1.75
查表(n=15, k=2, α=5%)得du =1.543。
1.543<DW′= 1.75 <2
结论:无自相关。
(3)DW= 1.56,查表(n=30, k=5, α=5%)得dL =1.071, du =1.833。
1.071<DW= 1.56 <1.833
结论:无法判断是否存在自相关。
3.4
(1) 横截面数据.
(2) 不能采用OLS法进行估计,由于各个县经济实力差距大,可能存在异方差性。
(3) GLS法或WLS法。
3.5
(1)可能存在多重共线性。因为①X3的系数符号不符合实际.②R2很高,但解释变量的t值低:t2=0.9415/0.8229=1.144, t3=0.0424/0.0807=0.525.
解决方法:可考虑增加观测值或去掉解释变量X3.
(2)DW=0.8252, 查表(n=16,k=1,α=5%)得dL=1.106.
DW=0.8252< dL=1.106
结论:存在自相关.
单纯消除自相关,可考虑用科克伦-奥克特法或希尔德雷斯-卢法;进一步研究,由于此模型拟合度不高,结合实际,模型自相关有可能由模型误设定引起,即可能漏掉了相关的解释变量,可增加相关解释变量来消除自相关。
3.6 存在完全多重共线性问题。因为年龄、学龄与工龄之间大致存在如下的关系:Ai=7+Si+Ei
解决办法:从模型中去掉解释变量A,就消除了完全多重共线性问题。
3.7 (1)若采用普通最小二乘法估计销售量对广告宣传费用的回归方程,则系数的估计量是无偏的,但不再是有效的,也不是一致的。
(2)应用GLS法。设原模型为
(1)
由于已知该行业中有一半的公司比另一半公司大,且已假定大公司的误差项方差是小公司误差项方差的两倍,则有 ,其中 。则模型可变换为
(2)
此模型的扰动项已满足同方差性的条件,因而可以应用OLS法进行估计。
(3)可以。对变换后的模型(2)用戈德弗尔德-匡特检验法进行异方差性检验。如果模型没有异方差性,则表明对原扰动项的方差的假定是正确的;如果模型还有异方差性,则表明对原扰动项的方差的假定是错误的,应重新设定。
3.8(1)不能。因为第3个解释变量( )是 和 的线性组合,存在完全多重共线性问题。
(2)重新设定模型为
我们可以估计出 ,但无法估计出 。
(3)所有参数都可以估计,因为不再存在完全共线性。
(4)同(3)。
3.9(1)R2很高,logK的符号不对,其 t值也偏低,这意味着可能存在多重共线性。
(2)logK系数的预期符号为正,因为资本应该对产出有正向影响。但这里估计出的符号为负,是多重共线性所致。
(3)时间趋势变量常常被用于代表技术进步。(1)式中,0.047的含义是,在样本期内,平均而言,实际产出的年增长率大约为4.7%。
(4)此方程隐含着规模收益不变的约束,即a+b=1,这样变换模型,旨在减缓多重共线性问题。
(5)资本-劳动比率的系数统计上显著,符号也对了,看起来多重共线性问题已得到解决。
(6)两式中R2是不可比的,因为两式中因变量不同。
3.10(1)所作的假定是:扰动项的方差与GNP的平方成正比。模型的估计者应该是对数据进行研究后观察到这种关系的,也可能用格里瑟法对异方差性形式进行了实验。
(2)结果基本相同。第二个模型三个参数中的两个的标准误差比第一个模型低,可以认为是改善了第一个模型存在的异方差性问题。
3.11 我们有
原假设H0: 备则假设H1:
检验统计量为:
用自由度(25,25)查F表,5%显著性水平下,临界值为:Fc=1.97。
因为F=2.5454>Fc=1.97,故拒绝原假设原假设H0: 。
结论:存在异方差性。
3.12 将模型变换为:
若 、 为已知,则可直接估计(2)式。一般情况下, 、 为未知,因此需要先估计它们。首先用OLS法估计原模型(1)式,得到残差et,然后估计:
其中 为误差项。用得到的 和 的估计值 和 生成
令 ,用OLS法估计
即可得到 和 ,从而得到原模型(1)的系数估计值 和 。
3.13 (1)全国居民人均消费支出方程:
= 90.93 + 0.692 R2=0.997
t: (11.45) (74.82) DW=1.15
DW=1.15,查表(n=19,k=1,α=5%)得dL=1.18。
DW=1.15<1.18
结论:存在正自相关。可对原模型进行如下变换:
Ct -ρCt-1 = α(1-ρ)+β(Yt-ρYt-1)+(ut -ρut -1)
由
令:C¢t= Ct –0.425Ct-1 , Y¢t= Yt-0.425Yt-1 ,α’=0.575α
然后估计 C¢t=α¢+βY¢t + εt ,结果如下:
= 55.57 + 0.688 R2=0.994
t:(11.45) (74.82) DW=1.97
DW=1.97,查表(n=19,k=1,α=5%)得du=1.401。
DW=1.97>1.18,故模型已不存在自相关。
(2)农村居民人均消费支出模型:
农村: = 106.41 + 0.60 R2=0.979
t: (8.82) (28.42) DW=0.76
DW=0.76,查表(n=19,k=1,α=5%)得dL=1.18。
DW=0.76<1.18,故存在自相关。
解决方法与(1)同,略。
(3)城镇: = 106.41 + 0.71 R2=0.998
t: (13.74) (91.06) DW=2.02
DW=2.02,非常接近2,无自相关。
3.14 (1)用表中的数据回归,得到如下结果:
=54.19 + 0.061X1 + 1.98*X2 + 0.03X3 - 0.06X4 R2=0.91
t: (1.41) (1.58) (3.81) (1.14) (-1.78)
根据tc(α=0.05,n-k-1=26)=2.056,只有X2的系数显著。
(2)理论上看,有效灌溉面积、农作物总播种面积是农业总产值的重要正向影响因素。在一定范围内,随着有效灌溉面积、播种面积的增加,农业总产值会相应增加。受灾面积与农业总产值呈反向关系,也应有一定的影响。而从模型看,这些因素都没显著影响。这是为什么呢?
这是因为变量有效灌溉面积、施肥量与播种面积间有较强的相关性,所以方程存在多重共线性。现在我们看看各解释变量间的相关性,相关系数矩阵如下:
X1 X2 X3 X4
1
0.896
0.880
0.715
0.896
1
0.895
0.685
0.880
0.895
1
0.883
0.715
0.685
0.883
1
X1
X2
X3
X4
表中r12=0.896,r13=0.895,说明施肥量与有效灌溉面积和播种面积间高度相关。
我们可以通过对变量X2的变换来消除多重共线性。令X22=X2/X3(公斤/亩),这样就大大降低了施肥量与面积之间的相关性,用变量X22代替X2,对模型重新回归,结果如下:
=-233.62 + 0.088X1 + 13.66*X2 + 0.096X3 - 0.099X4 R2=0.91
t: (-3.10) (2.48) (3.91) (4.77) (-3.19)
从回归结果的t值可以看出,现在各个变量都已通过显著性检验,说明多重共线性问题基本得到解决。
第四章 极大似然估计与GMM 估计
4.1 由于观测是独立的,所以n次观测的联合密度即这个样本的似然函数为
其对数似然函数为:
由极值得一阶条件可得:
对于所给定的观测样本,有:
ln
因此, 的极大似然估计值 。
4.2
即
自这一方程解得
分别以 代替 ,得到 的矩估计量分别为(注意到 ):
4.3 应该选择三种方法中的W检验。原因:在本题中,约束条件为非线性函数的形式,无约束方程是一个线性回归方程,而约束条件加上后的有约束方程为参数非线性的回归方程。LR检验需要估计无约束方程和有约束方程;LM检验需要估计有约束方程,由于约束方程参数非线性,所以计算工作也较大;相对前面两种方法,W检验仅需估计无约束方程,而无约束方程是一个线性方程,计算工作量最小。
4.4
广义矩法直接从模型所施加的矩条件来估计模型,矩条件的一般形式为:
为了估计 ,我们考虑上述矩条件的样本对应物
在矩条件的个数大于参数的个数( )的情况下,我们不能通过设定矩条件为0来唯一确定参数向量 的估计量,为了充分利用 个矩条件的信息,我们只能转而借助最优化方法的思路,选择使得样本矩向量从总体上尽可能接近于0的 的估计量。这就是广义矩估计方法的思路。具体的做法是将下面的加权平方和(亦称为距离函数)
作为目标函数,求出使该目标函数达到最小的 的值 ,就得到GMM估计量。上式中, 为任意正定矩阵,称为权矩阵。
4.5 广义矩方法直接从模型所施加的矩条件来估计模型。与其它估计法相比,GMM法有下列几个显著的优点:
(1) 它无需规定正态分布之类的有关分布的假设,GMM估计量的一致性仅取决于矩条件的正确设定;
(2)它为那些传统估计方法计算很困难特别是模型无法解析求解的情况提供了一种方便的方法;
(3)它为很多类似估计量,如ML、OLS、IV等的分析提供了一个统一的框架。
4.6 OLS估计结果:CZSR=-675.3+0.026 GDP+0.939 TAX =0.9987 t (2.86) (19.91)
ML估计结果: CZSR=-675.3+0.026 GDP+0.939 TAX
z (3.61) (26.46)
可见,在线性回归条件下,OLS和ML的系数估计结果完全相同。
GMM估计的EViews结果如下:
GMM估计结果
Dependent Variable: CZSR
Method: Generalized Method of Moments
Date: 01/20/09 Time: 21:14
Sample (adjusted): 1991 2007
Included observations: 17 after adjustments
Kernel: Bartlett, Bandwidth: Fixed (2), No prewhitening
Simultaneous weighting matrix & coefficient iteration
Convergence achieved after: 1 weight matrix, 2 total coef iterations
Instrument list: GDZC TAX(-1) C
Variable
Coefficient
Std. Error
t-Statistic
Prob.
GDP
0.036881
0.016569
2.225889
0.0430
TAX
0.889754
0.085142
10.45021
0.0000
C
-1080.255
554.1925
-1.949241
0.0716
R-squared
0.998746
Mean dependent var
16372.43
Adjusted R-squared
0.998566
S.D. dependent var
13734.44
S.E. of regression
520.0252
Sum squared resid
3785967.
Durbin-Watson stat
1.137633
J-statistic
7.80E-27
从上述结果,我们有:
CZSR=--1080.3+0.037 GDP+0.890 TAX =0.9987
t (2.23) (10.45)
第五章 非线性回归模型
5.1 如果目标函数 为凸函数,则 至多有一个极小点,且局部极小即是整体最小,迭代会收敛到最小值,但初值的选择对迭代速度的影响相当大。如果目标函数 不是凸函数但有唯一极小点,迭代也会有不错的效果。但如果目标函数 有多于一个的极小点,迭代可能收敛到局部极小点,不能保证是整体最小点,则迭代那么初值的选择就更加重要。
5.2 判断迭代收敛并没有一致接受的标准,通常的标准有:
(1)目标函数的改进小于给定的正数 ,即
(2)参数值的变化小于给定的正数 ,
(3)梯度向量与零的距离小于给定的正数 ,
(4)上述三个收敛原则不能完全令人满意,一个原因是它们都与参数的量级有关。一个与量级无关的停止规则是
上式的优点在于给梯度分量以不同的权重,权重的大小与对应参数估计的精度成反比。收敛标准中 是一个很小的正数,由使用者选择。一般的 值通常在 到 之间。
5.3 牛顿-拉弗森法和拟牛顿法(包括戈德菲尔德-匡特方法、戴维森-弗莱彻-鲍威尔法与高斯-牛顿法)。
5.4 (1) 采用EViews软件,在主菜单选Quick ®Estimate Equation…,在方程设定对话框中输入方程:y=c(1)*k^c(2)*L^c(3),采用LS估计方法,即可得到模型参数的NLS估计。结果如下:
Dependent Variable: Y
Method: Least Squares
Date: 01/29/09 Time: 23:33
Sample: 1 39
Included observations: 39
Estimation settings: tol= 1.0e-12, derivs=analytic
Initial Values: C(1)=0.00000, C(2)=0.00000, C(3)=0.00000
Convergence achieved after 54 iterations
Y=C(1)*K^C(2)*L^C(3)
Coefficient
Std. Error
t-Statistic
Prob.
C(1)
7.632622
6.198935
1.231280
0.2262
C(2)
0.575950
0.073433
7.843225
0.0000
C(3)
0.366602
0.110376
3.321408
0.0021
R-squared
0.827574
Mean dependent var
8117.666
Adjusted R-squared
0.817995
S.D. dependent var
7986.997
S.E. of regression
3407.416
Akaike info criterion
19.17910
Sum squared resid
4.18E+08
Schwarz criterion
19.30707
Log likelihood
-370.9924
Durbin-Watson stat
1.653097
(2)
得到上述结果之后,打开View®Coefficient Tests®Wald -Coefficient Restrictions,在对话框键入c(2)+c(3)=1,得
Wald Test:
Equation: Untitled
Test Statistic
Value
df
Probability