全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件
5999 3
2013-02-18
今天读了wooldridge的书,彻底从理论上厘清了pooling和panel的区别。翻译过来就是:pooling里的所有样本彼此都不相关,是随机获得的。而panel的数据,从时间序列上看,第一个截面里的数据不相关,从第二个时间点的截面开始,到最后一个时间点,其样本都与第一个截面的样本完全相关(或曰:都是第一个截面的样本)。

英文原版说明见附件。
panel pool.pdf
大小:(89.84 KB)

只需: 1 个论坛币  马上下载



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-2-18 13:26:18
你的意思是说:如果是pooling,NT个样本全部是iid抽样得到的,如果是panel,NT个样本在每个截面是iid的,但是每个个体在截面和截面之间是correlated的。我觉得你关于pooling的理解是没什么问题的,关于panel则说的不是很精确。

我们可以考虑用更精确的语言来理解这个问题,panel data有一个error component的结构:u_it=v_i+e_it,其中error term e_it是完全随机的,而individual effect: v_i是不是完全随机的,则取决于你是用fixed effect还是random effect,如果是random effect,我们会假设v_i和X_i是不相关的,这种情况下直接用OLS可以得到一致的估计量,但是不够有效,标准差需要进行cluster-robust调整,或直接采用GLS来估计。如果是fixed effect,那么v_i和X_i是相关的,这时候用OLS估计就是不一致的,必须要采用fixed effect来估计。

而至于pooling,则根本不考虑存在individual effect,直接用OLS就OK了。

最后请教你一个问题,如果你观测2000个家庭,一共观测了两年(紧挨着的),你现在想要估计教育年限对于收入的影响,请问你是应该把这4000个观测点看成是pooling呢,还是看成panel data?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-2-19 12:06:05
remlus 发表于 2013-2-18 13:26
你的意思是说:如果是pooling,NT个样本全部是iid抽样得到的,如果是panel,NT个样本在每个截面是iid的,但是 ...
多谢Remlus老师指点。作业汇报如下:无论2000样本如何选,这种情况用pooling都不好。因为pooling会整没了fixed变量,造成有偏。除非弄一个超完备的自变量集。

请指正。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-2-19 12:25:14
longwo 发表于 2013-2-19 12:06
多谢Remlus老师指点。作业汇报如下:无论2000样本如何选,这种情况用pooling都不好。因为pooling会整没了 ...
晕,你不要这么客气,我不是知道答案再问你的,我确实不太清楚啊。这种教育的情况是比较极端的了,但我经常遇到那种变量,你说它随时间有变化吧它变化不大,没变化吧它不管怎么说又确实有一点,譬如说企业的资本结构,每个企业的资本结构随时间变化不大是比较稳定的,但这又恰恰说明很可能有比较强的个体效应存在,这时候你用fixed effect你的组内变化太小,估计不出什么东西来,似乎只能用random effect或者是pooling了,但是randome effect也好pooling也好,都要求v_i和X_i是不相关的,这一般又不能满足。所以我的观点是,如果你要用panel做,碰到上述这种问题,要么你期数多一点,这样用fixed effect也能有比较大的组内变化,如果期限短,除非有明显的外生冲击譬如政策冲击,导致这个变量随时间发生很大变化,否则就意义不大,不如直接做pooling或者对截面回归,pooling相对于截面回归唯一的好处就是样本观测值多一点,这时候可能不得不去寻找横截面意义上的工具变量,当然也很难找。

没有哪本书上明确说过该怎么做,这只是我自己的一点看法,请指正。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群