一、数据介绍数据名称: Goverment工作报告-数字经济政策词频
数据范围:全国31个省份
数据年份:2002-2023年(平衡面板为2007-2023年)
数据来源:地方Government网
数据说明:内含数字经济相关的60个词频明细、文本长度、文本词频总数
二、整理说明从网站爬取工作报告原始文件
将报告文本整理为面板数据
去除停顿词,利用python的jieba库进行精确模式和全模式分词,统计词频
保留中英文、数字、标点符号,利用正则表达式统计60个词频
保留中英文、数字,统计全文文本总长度
保存文本词频总数、60个词频明细、文本长度
三、指标说明一共71个指标,如下
行政区划代码 | 年份 | 地区 |
所属地域 | 长江经济带 | 文本总长度 |
仅中英文-文本总长度 | 文本总词频-全模式 | 文本总词频-精确模式 |
数字经济政策词频和-A | 数字经济政策词频和-B | 数字经济_A |
智能经济_A | 信息经济_A | 知识经济_A |
智慧经济_A | 数字化信息_A | 现代信息网络_A |
信息和通信技术_A | ICT_A | 通信基础设施_A |
互联网_A | 云计算_A | 区块链_A |
物联网_A | 数字化_A | 数字乡村_A |
数字产业_A | 电子商务_A | 5G_A |
数字基础设施_A | 人工智能_A | 电商_A |
大数据_A | 数据化_A | 产业数字化_A |
数字产业化_A | 数据资产化_A | 智慧城市_A |
云服务_A | 云技术_A | 云端_A |
电子政务_A | 移动支付_A | 线上_A |
信息产业_A | 软件_A | 信息基础设施_A |
信息技术_A | 数字生活_A | 智能制造_B |
智能化_B | 智慧化_B | 智慧城市_B |
云计算_B | 上云_B | 云平台_B |
云服务_B | 大数据_B | 数据安全_B |
数据服务_B | 数据治理_B | 数据共享_B |
工业互联网_B | 物联网_B | 区块链_B |
机器人_B | 5G_B | 数字技术_B |
数字化_B | 数字经济_B |
指标A是参考:金灿阳,徐蔼婷,邱可阳.中国省域数字经济发展水平测度及其空间关联研究[J].统计与信息论坛,2022,37(06):11-21.
指标B是参考:陶长琪,丁煜.数字经济政策如何影响制造业企业创新——基于适宜性供给的视角[J].当代财经,2022,No.448(03):16-27.DOI:10.13676/j.cnki.cn36-1030/f.2022.03.001.