20190121:修改一下
现已经完成1998-2013年数据的处理工作,不敢说自己处理的有多好,但可以说一句:真的很不错。也不好与他人进行比对,所以特给出200个(实际上有几万个)在数据匹配中容易出错的地方,需要大家处理的时候进行注意,也可以与自己处理的结果进行比对。有心的人估计能从Excel中看出我处理的思路(独创)。
----------------------------------------------------------------------------------------------------------------------------------------------------------
哈哈,第一次发帖试一试。
对于经管网站流传的数据库处理方式基本都是以Brandt(2012)【文章及数据处理代码下载地址:https://feb.kuleuven.be/public/n07057/China/】的处理代码为主,该方式处理数据较为粗糙。
聂辉华(2012)【文章:聂辉华,江艇,杨汝岱.中国工业企业数据库的使用现状和潜在问题[J].世界经济,2012,35(05):142-158.】的数据处理方式准确度较高,不过没有代码。
同学们在购买数据库后,可以通过比对1999-2007年间连续存在九年的企业个数,来初步判断自己购买的数据质量怎么样(聂辉华:全部工业企业中有46000个左右),这样一比较,大致可知道自己购买的数据靠谱不。
我自己花了些时间处理了一下,现在给大家1998-2007年的一个参考,要不我就卖一个论坛币吧(哈哈,我也要下载东西)。具体处理代码,明年毕业后再说。