全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
2574 2
2022-08-18
中国工业企业数据库全称为“全部国有及规模以上非国有工业企业数据库”(以下简称“工企库”),由中国国家统计局建立。工企库中的“工业”统计口径包括“国民经济行业分类”中的“采掘业”、“制造业”以及“电力、燃气及水的生产和供应业”三个门类。该数据库的样本范围曾经发生过两次变化,1998-2006年覆盖范围是全部国有工业企业及年主营业务收入500万元以上的非国有企业;2007-2010年,数据收集范围调整为年主营业务收入500万元及以上的所有工业企业;2011年开始,统计范围为年主营业务收入2000万元及以上的法人单位。由于工企库包含众多企业微观层面的基本信息和财务数据,具有涵盖样本大、指标丰富、时间跨度长等特点,近十多年来被学者广泛应用,每年都有使用该数据库的新论文被公布或者发表,主题早已涵盖产业组织理论、企业理论、公司金融、转型经济学、国际贸易、劳动经济学和区域经济学等诸多子学科(聂辉华等,2012)。近年来,一些学者开始将这一数据库与其他数据库进行横向匹配连接,以探索新的研究空间,如寇宗来和刘学悦(2020)将工企库与中国专利数据库(以下简称“专利库”)匹配融合,田巍和余淼杰(2013)将其与海关数据库匹配融合。各个企业微观数据库的连接,可以为相关学术研究提供更多变量组合,从而挖掘出更多的研究方向,能最大化各个数据库的使用价值。目前,已有研究探讨了工企库与专利库、海关数据库匹配的问题,但其与中国全量工商企业数据库(以下简称“工商库”)匹配的研究还很罕见。本文旨在通过工企库与工商库包含的共有信息完成两个数据库的横向匹配,为工企库添加统一标准的工商企业唯一标识码。这一工作有助于帮助我们将工企库的应用范围进一步拓展。具体来说,本文将工企库与工商库进行匹配的意义至少体现在如下四个方面:第一,扩充数据维度。工企库与工商库联接之后,可以获得规模以上工业企业历年股权投资、开设分支机构等信息,甚至可以利用2013年至今的企业工商年报数据,进一步丰富数据库的变量指标,为研究提供更多可能性。第二,有助于验证工企库的数据质量。工企库与工商库匹配后,可以获得企业的工商登记及其变更信息。已有对工企库数据质量的研究表明,该数据库的指标存在样本匹配混乱、指标存在缺失、指标大小异常、测度误差明显和变量定义模糊等现象(聂辉华等,2012)。工商库来源于国家企业信用信息公示系统,属于公共行政数据,近年来信息质量和准确性不断提升。通过添加企业的工商注册信息,可为工企库中部分数据信息质量核验提供新的依据。第三,改进工企库纵向匹配的质量。过往学者在对工企库进行利用时,需要解决的一个重点难题便是将历年数据整合成面板数据,这就需要应用不同年份中相同且可以识别出企业的变量来逐年对数据库进行纵向连接(Brandt et al,2014;杨汝岱,2015)。然而,无论从工作量还是工作难度上看,这种处理办法都不是最经济的。通过与拥有企业唯一识别码的工商库的横向连接,可以为历年工企库中的样本匹配一个标准企业唯一标识码,从而轻松构建面板数据。第四,提升跨数据库横向匹配的质量。引入工商库的企业唯一标识码,能更好地搭建起与其他数据库(包括专利库和海关数据库)横向连接的桥梁,不仅提升了跨数据库之间的横向匹配效率,还能显著提高匹配的准确度。具体来说,工企库与其他企业相关数据库之间的匹配,可以利用与工商库匹配得到的企业唯一标识码进行匹配,或者至少能够补充原来的匹配结果(本团队利用本文匹配成果支撑了工企库与专利库的匹配工作,详情参见《中国工业企业数据库与专利数据库匹配报告》)。查看《中国工业企业数据库与专利数据库匹配报告》全文请点击附件。
附件列表
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-8-18 15:59:42
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2024-6-15 22:59:53
中国工业企业数据库与全量工商企业数据库的匹配报告旨在探讨两个重要数据源之间的联系及潜在应用。前者是中国国家统计局构建的专业化、精细化的企业信息数据库,后者则是覆盖更广泛范围内的所有类型企业的综合性数据库。

**一、中国工业企业数据库(工企库)概况**

1. **样本范围与时间变化:**
   - 1998-2006年:全部国有工业企业及年主营业务收入500万元以上的非国有企业。
   - 2007-2010年:年主营业务收入500万元及以上的所有工业企业。
   - 自2011年起,门槛提升至年主营业务收入2000万元及以上的法人单位。

2. **统计口径与行业分类:**
   - 包括国民经济行业分类中的“采掘业”、“制造业”以及“电力、燃气及水的生产和供应业”。

3. **学术研究应用价值:**
   - 被广泛应用于经济学各子学科的研究,如产业组织理论、企业理论、公司金融等领域。
   - 通过与其他数据库匹配(例如专利库),为探索更深层次的经济问题提供了可能。

**二、全量工商企业数据库**

该数据库覆盖所有类型的企业信息,不仅包括工业企业,还涵盖服务业、商贸业等。由于其全面性和实时性,能够提供更为宏观和细致的市场分析数据。

**三、匹配与融合价值**

1. **深度研究:**
   - 学者们通过将工企库与其他专业数据库(如专利库)进行横向匹配连接,可以深入探讨企业创新活动、市场竞争格局等议题。
   
2. **综合分析:**
   - 将中国工业企业数据库与全量工商企业数据库相匹配,能够构建更全面的企业信息图谱,为政策制定者提供决策支持。

**四、未来展望**

随着数据分析技术的进步和跨学科研究的深化,工企库与各类其他数据库(如专利库)之间的融合应用将更加广泛。这不仅有助于推动经济学理论创新,也为解决实际经济问题提供了新的视角和工具。通过跨库匹配分析,能够更准确地把握市场动态、企业行为及政策效果,促进经济高质量发展。

综上所述,中国工业企业数据库与全量工商企业数据库的匹配研究对于深化学术理解、指导政策制定具有重要意义。未来,随着数据共享机制的完善和技术手段的进步,这一领域的研究成果将更加丰富和深入,为经济学研究和社会经济发展做出更大贡献。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群