这个问题比较复杂。
Access 的数据只能通过 Stat-Transfer 软件逐年转换为 Stata 格式的数据。
由于每年的数据都很大,无法合并后进行处理,因为内存通常不够,所以需要每年单独处理,完成后,仅保留需要参与估计的变量,再合并成一个大的数据进行后续的回归分析。
其他的细节:每年的数据中,变量名称可能不一致,需要手工校对;离群值也需要慎重处理。
具体可以参见
聂辉华, 江艇, 杨汝岱, 2012, “中国工业企业数据库的使用现状和潜在问题”, 世界经济, (5), pp. 142-158.
http://www.niehuihua.com/UploadFile/ea_201251019517.pdf