zxm403 发表于 2016-3-8 13:47 
请问用的是余淼杰的哪篇文章上给的方法完成匹配的
企业出口强度与进口中间品贸易自由化——来自中国企业的实证研究`
——田巍,余森杰
三合并数据
尽管这两套数据信息丰富,但是将它门合并到一起却并非易事。两套数据虽然都包括了企业编码,但是两套编制系统却完全不同,没有任何共同特征。比如,在海关数据中企业的编码是10位的,但是在企业数据中却是9位的。为克服这个难题,我们采用Yu和Tian(2012)介绍的方法,采用两种方式合并这两套数据, 首先我们根据企业的姓名和年份匹配, 也就是说,如果两个企业在同一年在两套数据中都有相同的名字,那么这两个企业应该是同一个企业, 这样如果使用原始的工业企业数据, 我们可以匹配83679家企业。如果使用筛选过后的企业数据, 则可以匹配69623家企业。
然后我们用使用了另外一种匹配技术,我们通过企业的邮政编码和最后位的电话号码进行匹配, 因为在每一个邮政地区中, 企业的电话号码都是不同的。尽管这个方法很直观, 但是仍然存在很多细微的实际操作的困难比如在企业数据中电话是包括分机号的,但是在海关数据中却没有, 因此我们采用了电话后7位作为企业认证的近似。
企业在每套数据中都有可能有名称或电话或邮编的缺失, 为了保证我们的匹配可以尽可能包括
更多的企业, 我们同时使用这两种匹配方法, 只要企业可以通过任何一种方法成功匹配,我们就将它
纳人合并数据中。如此, 用原始工业企业数据成功匹配的企业数上升到90558个。与其他类似的文献
比较,我们的匹配数目与他们大抵一样甚至更好。最后我们用筛选后的严格的企业数据匹配,得到
家企业。值得指出的是, 合并的成功率相对比较高,合并后的数据库中企业的总出口额占了规
模以上的数据库的出口额一半以上,与其他相关研究如等的匹配成功率相当。