1、以各省的ZF工作报告的数字经济相关关键词出现的频率来测度各省的数字经济关注度
2、共31个省份,时间跨度2007-2024年,共计527个样本观测值
3、参考金灿阳等(2022)、陶长琪等(2022)的研究,借助Python软件,统计数字经济相关的关键词词频。文件内含数字经济相关的60个词频明细、文本长度、文本词频总数等共71个指标
4、数据处理过程:(1)从地方政府网爬取地方政府工作报告原始文件;(2)将报告文本整理为面板数据;(3)去除停顿词,利用python的jieba库进行精确模式和全模式分词,统计词频和保留中英文、数字、标点符号,利用正则表达式统计60个词频;(4)保留中英文、数字,统计全文文本总长度(5)保存文本词频总数、60个词频明细、文本长度。
5、文件中的数字经济政策词频和A、数字经济政策词频和B分别是按照金灿阳(2022)、陶长琪(2022)给出的词频计算得到的结果。
6、参考文献:
[1] 陶长琪,丁煜.数字经济政策如何影响制造业企业创新——基于适宜性供给的视角[J].当代财经,2022,(03):16-27.
[2] 金灿阳,徐蔼婷,邱可阳.中国省域数字经济发展水平测度及其空间关联研究[J].统计与信息论坛,2022,37(06):11-21.
附件列表