数据介绍:
- 年份:2003-2025
- 范围:284市
- 文件格式:Dta格式(使用Stata打开)、Xlsx格式(使用Excel打开)
- 代码格式:do文件(Stata 14/15/16/17/18)
计算说明:
指标说明:ZF、数字关键词词频为各地区每年发布的工作报告中ZF、数字这两个关键词出现的频率即数字经济发展关注度。数字经济发展关注度分组变量是以各地区词频数的均值为标准将总样本划分为ZF数字经济发展关注度高地区和ZF数字经济发展关注度低地区两个子样本、数字经济发展关注度高的地区,该变量赋值为1;数字经济发展关注度低的地区,该变量赋值为0。
缺失情况说明:部分市早年工作报告已缺失无法搜集,缺失部分已剔除不在样本中,2003-2025年284个地级市应合计6532份原始文件,其中402份为缺失无法搜集的部分,这部分无法进行文本分析,其余6130份均按流程进行文本分析,词频文件为“原始数据xlsx”、“原始数据.dta”
处理说明:原始数据为使用Python对地方ZF工作报告进行文本分析后获得(jieba分词,停用词表使用哈工大停用词表),后续使用Stata进行整理,最终形成面板数据形式
参考文献:
- 张林,蒋李雯,丁晓兰.数字普惠金融发展能够缓解金融要素扭曲吗?[J].财经问题研究,2025,(04):82-97.
代码:
原始数据:
结果数据