数据介绍:
- 年份:2002-2025
- 范围:284个市(含直辖市)
- 文件格式:Dta格式(使用Stata打开)、Xlsx格式(使用Excel打开)
- 代码格式:do文件(Stata 14/15/16/17/18)
计算说明:
指标说明:基于文献中列示的关键词对各地区工作报告进行词频分析,加总后得到新质生产力总词频,用以衡量地区新质生产力发展水平
关键词:“新质生产力”关键词包括科技创新、自主创新、自立自强、杨心技术、产业结构升级、创业孵化、成果转化、人才培养、战略性新兴产业数字、智慧、算法、新一代信息技术、生物技术、新能源、新材料、新能源汽车高端装备制造、航空航天、绿色环保、大健康、海洋工程装备、元宇宙、脑机接口、全息显示、氢能、储能、自动驾驶、半导体、金融科技、智能制造、AI、云技术、大数据、物联网、工业互联网、集成电路
缺失情况说明:部分市早年工作报告已缺失无法搜集,缺失部分已剔除不在样本中,穿2003-2025年284父地市应合计6532份原始文件,其中402份为缺失无法搜集的部分,这部分无法进行文本分析,其余6130份均按流程进行文本分析,词频文件为“原始数据s“原始数据.dta”
处理说明:原始数据为使用Python对地方ZF工作报告进行文本分析后获得(jieba分词,停用词表使用哈工大停用词表),后续使用Stata进行整理,最终形成面板数据形式
参考文献
- 韩建雨,许冉.新质生产力对共同富裕的影响效应与作用机制[J].华南师范大学学报(社会科学版),2024,(06):32-57+199.
代码:
原始数据
结果数据