工欲善其事,必先利其器。写好学术论文的前提是熟练使用一款统计软件。当然这并不是说我们的终极目标就是学好统计软件,技术只是为思想服务的。本文基于Eviews编程建立面板数据,并人性化地给出了建模过程中可能出现的错误以及解决方法。
Eviews早期的版本对具有频率结构的时间序列数据支持很出色,对横截面数据和面板数据的支持很糟糕,关于各类经济计量分析软件的评价中,直到今天,不少评论都还只强调Eviews是时间序列分析的优秀软件。事实上,增强对结构数据的支持后,Eviews对横截面数据和面板数据的计量分析,立即走到了最前列。
他山之石,可以攻玉,读者可在本文的各源代码基础上按自己的需求进行修改,以达到事半功倍的目的。在很多代码后面都有单引号加上程序说明,单引号在eviews里被默认为注解,不会被执行,所以可以放心复制。
先无奈地科普一下面板数据的定义。面板数据(panel data)一词指的是一部分家庭、国家或企业等在一段时间内的观测值所构成的集合,虽然兼有横截面和时间序列维度,但在一些重要方面却不同于独立混合横截面,如果想要收集面板数据,我们要在不同时间跟踪相同的一些个人、家庭、企业、城市、州或别的什么单位。个体调查数据通常称为微观面板(micro panels),所搜集数据的特点是个体数N较大(通常是几百或几千个),而时期数T较短(最少是两年,最长不超过10年或20年)。宏观面板(macro panels)通常涉及一段时期内不同国家的数据。这类数据一般具有适度规模的个体N (从7到100或200不等,如G7、OECD、欧盟等),时期数T一般在20-60年之间。
废话这么多,可以开始建立面板数据了吗?!
在建立面板数据之前,我们还有几点需要理解。
首先是“平衡”面板数据和“非平衡”面板数据。所谓平衡面板数据就是案例中的每一个个体都能追踪到其观测数据,没有缺失项。而非平衡面板的意思就是至少有一个截面个体的观测与其余观测不同,比如说在搜集美国航空公司的跨期数据时,在观测的样本区间内,一些公司已经退出了市场,而同时又有新的公司进入该行业。简单的说就是数据包含一些随机缺失的观测值。
其次是“规则”和非规则“面板。规则面板就是日期是规则的,比如说1990年之后是1991年,然后是1992年,1990,1991,1992,1993……”非规则“的应用在金融领域似乎更为常见,比如说股票市场里节假日和周末都是不交易的,这个时候的数据就是缺失的,对应到每家公司情况更复杂,由于突发事件导致的停牌也会使得当天没有交易记录。在宏观经济领域,有时候我们会发现某些年度的数据是缺失的,比如1990年幼记录,而1991年没有,1990,1992,1993……这样的数据就是非规则的。
在对上述问题有了基本了解之后,我们就可以开始建立面板数据了。首先建立平衡的面板数据,有两种方法,一是通过合伙序列(pooled object)建立,二是通过群对象(group object)建立.