基于各省份政府工作报告中01-24年新质生产力关注度的文本词频统计数据,可以进行以下研究:
政策导向分析:研究各省份政府在不同时期对新质生产力的重视程度及政策导向变化。
区域差异研究:分析不同省份在推动新质生产力发展方面的差异,探讨区域发展不平衡的原因。
发展趋势预测:结合历史数据,预测未来各省份新质生产力的发展趋势,为政策制定提供参考。
政策效果评估:评估政府政策对新质生产力发展的实际影响,包括技术创新、产业升级等方面。
经济效应分析:研究新质生产力发展对各省份经济增长、就业结构、环境质量等方面的经济效应。
数据名称:各省份政府新质生产力关注度01-24年基于工作报告的文本词频统计数据
数据来源:
基于各省政府工作报告。
数据指标:
本数据集展示了2001-2024年各省政府工作报告中的新质生产力词频统计数据。
注:本数据收集的具体过程如下
第一,定义种子词汇。基于国家发展和改革委员会网站公布的资料,确定了包括“新质生产力”、“数字经济”等在内的16个种子词汇。这些词汇涵盖了新质生产力的核心特征,如数字化、智能化、高效能等。
(
https://www.ndrc.gov.cn/wsdwhfz/202402/t20240206_1363980.html)
第二,根据确定的16个种子词汇,借助Word2Vec神经网络模型,运用
深度学习的技术手段,从2023年9月至2024年4月间国家发展和改革委员会网站发布的有关“新质生产力”新闻文章中提取与种子词汇语义相近的词汇。为确保测量的精确性,本研究仅保留了那些与种子词汇相似度超过0.85的词汇,同时排除了与主题无关的词汇,如人名。
第三,挖掘各省政府年度报告中种子词汇与相似词词汇在其中出现的频数,为了便于比较,将词频加一后取自然对数。最终,识别出61个与新质生产力相关的高频词汇,包括但不限于“量子”、“数据”“高效能”、“科技创新”、“低损耗”等。词库包含的61个词汇详见下。
16个种子词展示如下:
新质生产力 数字经济 数字化 智能化 网络化 先进生产力 信息技术 高科技 高效能 高质量 生物技术 能源技术
材料科学 数据 科技创新 高新技术