指数测算细节
1. 获取历年省级地方政府工作报告;
2. 中文分词处理,分词过程中考虑新质生产力相关词汇,并剔除常见停止词;
4. 统计每个地区。每年的词频数据,基于TF-IDF算法计算每个地区、每年、各词TF-IDF值;
5. 将新质生产力相关词汇的TF-IDF值加总,得到各地区历年新质生产力政策强度指数。
关键词
新质生产力、人工智能、科技创新、技术革新、科学发展、创新动能、颠覆性技术、突破性技术、革命性创新、新技术、前沿技术、高新技术、尖端技术、新能源、新经济、数字经济、创新经济、未来经济、新业态、数字化转型、产业升级、新模式、战略性新兴产业、未来产业、高科技产业、新动能产业、创新驱动技术驱动、创新引领、重大突破、提高生产力、质的转变、提升生产力、高效能、高性能、高效率、高产出、高质量发展、质量优先、效益提升、高标准发展、主导技术、创新领先、科技引领、关键突破、核心技术突破
时间区间:2002-2024
数据文件说明
1. 省级np_data.xlsx
region:省份
year:年份
n:所有新质生产力相关词汇的词频和
tf_idf:所有新质生产力相关的TF-IDF值之和(乘以10000),即新质生产力政策强度指数
2. 省级np_words_freq&tf_idf.xlsx
value:关键词(46个)
n:每个新质生产力相关词汇的词频
region:省份
year:年份
tf:每个新质生产力相关词汇的标准化词频
idf:每个新质生产力相关词汇的逆文档频率
tf_idf:每个新质生产力相关词汇的TF-IDF值