连老师您好,在初级视频A2数据处理中,2.11小节面板数据处理(2836~2848行)以及在文献Flannery视频中(101~103行),均出现了panels命令的应用。以财务数据为例,其用法主要统计“公司”或者说是个体标识在某年或某个行业出现的次数,对样本分布能够有一个直观的感觉。
比如,panels id : tab sic2 //这个命令考察每个行业包含几个不同的公司
但是,讲义又给出了如下的命令,
panels id:tab sic2 year //按照对panels命令的理解,这个命令应该是考察各行业在每年中不同公司的分布情况。但是,运行的结果使人无法理解数据到底表达了什么。
比如考察,gta_sample.dta,的例子,
panels id : tab province //各省包含的不同公司个数
panels id if province==5 :tab province year //为了简便起见,仅考察广东的情况
上述命令执行之后,广东省包含的不同公司的个数是没有问题的,有16个。
但是,第二条命令就匪夷所思了,命令执行结果如下
| 1998 | 1999 | 2000 | 2003 | 2006 | 2007 | 2008 |
| 1 | 2 | 1 | 1 | 1 | 5 | 5 |
累计和也是16个,但是,如何确定的各年公司数呢?我核对了原始数据也没看出逻辑所在。请连老师帮忙。谢谢。