全部版块 我的主页
论坛 休闲区 十二区 灌水吧
9984 60
2018-12-23
20190121:修改一下
现已经完成1998-2013年数据的处理工作,不敢说自己处理的有多好,但可以说一句:真的很不错。也不好与他人进行比对,所以特给出200个(实际上有几万个)在数据匹配中容易出错的地方,需要大家处理的时候进行注意,也可以与自己处理的结果进行比对。有心的人估计能从Excel中看出我处理的思路(独创)。

----------------------------------------------------------------------------------------------------------------------------------------------------------

哈哈,第一次发帖试一试。
对于经管网站流传的数据库处理方式基本都是以Brandt(2012)【文章及数据处理代码下载地址:https://feb.kuleuven.be/public/n07057/China/】的处理代码为主,该方式处理数据较为粗糙。
聂辉华(2012)【文章:聂辉华,江艇,杨汝岱.中国工业企业数据库的使用现状和潜在问题[J].世界经济,2012,35(05):142-158.】的数据处理方式准确度较高,不过没有代码。
同学们在购买数据库后,可以通过比对1999-2007年间连续存在九年的企业个数,来初步判断自己购买的数据质量怎么样(聂辉华:全部工业企业中有46000个左右),这样一比较,大致可知道自己购买的数据靠谱不。
我自己花了些时间处理了一下,现在给大家1998-2007年的一个参考,要不我就卖一个论坛币吧(哈哈,我也要下载东西)。具体处理代码,明年毕业后再说。

本人数据处理1998-2007年企业存在时间数结果 网上叫卖1998-2007年企业存在时间个数

附件列表

上传不一致样本.xlsx

大小:45.17 KB

只需: 10 个论坛币  马上下载

数据匹配中容易出错样本实例

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-12-26 10:52:04
忘了,附件内容只是制造业企业的存在的时间分布情况。抱歉
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-12-29 15:06:06
hhwm_310 发表于 2018-12-26 10:52
忘了,附件内容只是制造业企业的存在的时间分布情况。抱歉
楼主你好,我还是没怎么看懂你的结果,请问匹配完后还剩多少观测值数量?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-12-29 15:46:16
ldh293 发表于 2018-12-29 15:06
楼主你好,我还是没怎么看懂你的结果,请问匹配完后还剩多少观测值数量?
我的只是对制造业进行了处理,非制造业进行了删除,这样的话在1998-2007年,我使用的制造业数据为2048053个(其中真正使用的为2047434,有619个数据人工鉴别后发现有些无法归类,就人为去掉了。)不知道,你现在感觉怎么样
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-12-29 18:26:36
hhwm_310 发表于 2018-12-29 15:46
我的只是对制造业进行了处理,非制造业进行了删除,这样的话在1998-2007年,我使用的制造业数据为2048053 ...
嗯嗯,清楚了,谢谢了哈,方便加个微信或扣扣交流吗
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-1-3 15:10:43
ldh293 发表于 2018-12-29 18:26
嗯嗯,清楚了,谢谢了哈,方便加个微信或扣扣交流吗
都可以的,要不我加你吧。其实,数据处理就是那么点问题的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群