数据介绍:
- 年份:2002-2025
- 范围:31省
- 文件格式:Dta格式(使用Stata打开)、Xlsx格式(使用Excel打开)
- 代码格式:do文件(Stata 14/15/16/17/18)
计算说明:
指标说明:基于文献中列示的关键词对各地区工作报告进行词频分析,加总后得到新质是生产力总词频,用以衡量地区新质生产力发展水平。
关键词:“新质生产力”关键词包括科技创新、自主创新、自立自强、核心技术、产业结构升级、创业孵化、成果转化、人才培养、战略性新兴产业数字、智慧、算法、新一代信息技术、生物技术、新能源、新材料、新能源汽车高端装备制造、航空航天、绿色环保、大健康、海洋工程装备、元宇宙、脑机接口、全息显示、氢能、储能、自动驾驶、半导体、金融科技、智能制造、A、云技术、大数据、物联网、工业互联网、集成电路。
缺失情况说明:2002年度之前的部分市早年工作报告已缺失无法搜集,缺失部分已剔除不在样本中。2002-2025年度期间数据不存在缺失值,词频文件为“原始数据xlsx”“原始数据.dta”。
处理说明:本资料所使用的词频数据为使用Python对地方ZF工作报告进行文本分析后获得(jieba分词,停用词表使用哈工大停用词表),后续使用Stata进行整理,最终形成面板数据形式。
参考文献
- 韩建雨,许冉.新质生产力对共同富裕的影响效应与作用机制[J].华南师范大学学报(社会科学版),2024,(06):32-57+199.
代码:
原始数据:
结果数据