puzzleme 发表于 2012-1-10 12:12 
有多少个内生和外生变量在模型中,这个问题要怎么样才能说清楚呢?我现在准备做的是但方程估计。
如果是OLS,你的观测值的数量得大于你的变量个数,这样identification condition才能被满足。比如你的每个时间序列有20个观测值,那么只要你的自变量个数小于20就可以了。其实这个条件不是很难满足。当然样本的大小对OLS估计值的consistency很有关系。根据Wooldrigde,样本必须大于20个,不然consistency没有办法满足。也就是说在20个左右的样本估计的OLS估计值可能没有问题,但是inference都失效(比如t检验),因为你没有办法保证残差项是服从正态分布的。如果样本足够大,我们可以说残差项是近似正太分布的(asympototic normality),从而保证了t检验等有效。当然,在协整的情况下,我们有superconsistency,也就是渐进到正态分布的速度是普通OLS的一倍。你还可以看一下你的数据本身是不是正态分布,如果是,那么样本大小就不是问题了,但是我估计基本上都不是吧。
一个简单的例子关于观测值和变量的关系。OLS估计量是
beta=(X'X)^(-1)X'y
期中X是一个N 乘以K的矩阵。N表示观测值个数,K表示变量个数(或者参数个数)。注意(X'X)^(-1)
是一个K乘以K的矩阵而且这个矩阵式可逆的,那么就是说在原矩阵X中,rank是K而不是N。如果N<K,矩阵(X'X)^(-1)将不再是可逆的,那么我们就无法得到上面的OLS估计量了。所以N>K是一个保证OLS估计量得到的必要条件。