最新·中国工业企业数据库详细匹配合并步骤(含Stata数据匹配do代码&指标对照说明)
这里只介绍工业企业数据库的匹配具体过程,早在Brandt, L., et al. (2012) "Creative accounting or creative destruction? Firm-level productivity growth in Chinese manufacturing."Journal of Development Economic 97(2): 339-351.的论文附件中给出了《中国工业企业数据库》的匹配方法。
但是,Brandt, L., et al. (2012)在匹配工业企业数据库的时候,用主营产品加上企业所在地等信息作为企业的识别和匹配条件。虽然这样的做法可以提高样本的匹配成功率,但也可能导致企业的错误匹配。同时,Brandt, L., et al. (2012)的匹配代码也比较复杂。
最新·中国工业企业数据库详细匹配合并步骤(含Stata数据匹配do代码&指标对照说明)
工业企业数据处理流程:
1. 工业企业数据的原始格式为 access 格式,分年度存储于单独的文件中,可以采用 Stat-Transfer 逐年转换成 Stata 格式。
2. 由于原始数据的变量名称均为中文,因此在转换过程中 Stata-Transfer 会自动将变量名称修改为英文,名称依次为 v1, v2, ……。在设定 Stat-Transfer 时,需要选中标签选项,以便将 access 数据库中原始的中文变量名称保留为上述自动生成的英文变量名的中文标签。否则,我们很难把各个年度的变量对应起来。
3. 完成上述转换后,可以得到各个年度的 Stata 格式的数据文件。尚需作如下处理:
3.1 由于各个年度中同一个变量,可能命名方式有所差异,需要逐个校对;
3.2 不同年度中变量的个数会有所差异,有些年度新增了一些变量,而另一些年度则会减少一些变量;
3.3 为此,需要按照本表中从 Sheet S0-S5 流程重新校对和编码,然后为新定义的变量增加变量标签。
4. 。。。。。。
附件列表