数据来源
基于各地级市政府工作报告
时间跨度
2011-2024年
数据范围
各地级市
数据指标
本数据集展示了2011-2024年各地级市政府工作报告中的新质生产力词频统计数据。
注:本数据收集的具体过程如下
第一,定义种子词汇。基于国家发展和改革委员会网站公布的资料,确定了包括“新质生产力”、“数字经济”等在内的16个种子词汇。这些词汇涵盖了新质生产力的核心特征,如数字化、智能化、高效能等。
(https://www.ndrc.gov.cn/wsdwhfz/202402/t20240206_1363980.html)
第二,根据确定的16个种子词汇,借助Word2Vec神经网络模型,运用深度学习的技术手段,从2023年9月至2024年4月间国家发展和改革委员会网站发布的有关“新质生产力”新闻文章中提取与种子词汇语义相近的词汇。为确保测量的精确性,本研究仅保留了那些与种子词汇相似度超过0.85的词汇,同时排除了与主题无关的词汇,如人名。
第三,挖掘各地级市政府年度报告中种子词汇与相似词词汇在其中出现的频数,为了便于比较,将词频加一后取自然对数。最终,识别出61个与新质生产力相关的高频词汇,包括但不限于“量子”、“数据”“高效能”、“科技创新”、“低损耗”等。
16个种子词展示如下:
新质生产力
|
数字经济
|
数字化
|
智能化
|
网络化
|
先进生产力
|
信息技术
|
高科技
|
高效能
|
高质量
|
生物技术
|
能源技术
|
材料科学
|
数据
|
科技创新
|