Stata实证:数据结构整理
面板数据结构是我们最常用的结构,但有时候,我们从各种网站下载的数据并不满足这种结构,因此需要我们进行处理。本案例处理的数据结构如下所示:
 
注:a、b、c不是单元格的数值,这里仅用来标识位置,下同。
这份数据横轴为年份,纵轴为不同维度的y值,这种数据结构并不能使用reshape命令直接转换为面板数据,如下所示:
 
以下是具体数据,包含y1-y9&2001-2019年的数据:
 
为了方便导入stata进行处理,我们做了一个简便的处理:
  1)补全列信息,使得每个观测值都有对应的vars维度的数据,来指示所属的y的类型
2)给年份数据加了“value”前缀,主要原因是stata不允许变量名为数字开头,也可以加上其他前缀,例如下划线“_”。
 
结果截图:
 
注:附件截图:
 
注:1)若do文件乱码,可以使用windows自带的记事本打开。
2)附件包含日志文件,可使用用stata打开,即可看到类似窗口命令的结果。
    3)本篇章对于新手更具有启示作用,能够熟练处理数据的高手请忽视。
注:新上传附件,在说明文件更新了图2,其余不变,所以已经下载过了文件的,没必要再下,没下载的,且准备下载的,请选择下方更新的附件下载。