一、数据名称:1998-2014年中国工业企业专利数据与匹配数据
二、数据简介:越来越多关于创新的研究开始探索使用微观专利数据来测量企业创新成果(Hall和Harhoff,2012;Hall,2013)。用专利数据测量创新活动,其优势在于专利权制度本身可以诱导创新。本帖提供1998-2014年中国工业企业数据以及中国工业企业专利数据。数据来源为国家统计局、中国专利申请数据库。中国专利申请数据库统计了专利申请编号、申请企业、专利类型、专利描述等内容, 依据企业名称汇总每年专利申请数目, 然后依据企业名称与中国工业企业数据库进行匹配, 具体匹配操作流程、步骤参照 He 等(2018)的研究HE Z, TONG T, ZHANG Y, HE W. A Database Linking Chinese Patents to China’s Census Firms[J] . Scientific data, 2018, 5, 180042
三、数据来源:国家统计局、中国专利申请数据库
四、样本区间:工业企业专利数据1998-2014
五、样本量:2014年工企专利匹配后数据20万+
六、具体内容:原始+匹配+匹配dofile+运行日志
七、数据说明:工业企业和专利的匹配数据及dofile(98-13)
来源为top高校查询数据库,数据质量完整。原始数据为98-15年
根据企业名词+省地县码等变量,人工匹配,附匹配代码和运行日志。匹配数据为98-13年
八、特别注意:运行匹配dofile,需提前空置至少120个G的空间
如果存在乱码:
解决方式1:用stata13打开,stata13-MP在附件中有
解决方式2:使用以下代码进行转码,即可。 (其中* 代表需要转码的dta文件)
unicode encoding set gb18030
unicode analyze *
unicode translate * ,invalid(mark)
九、数据截图: