数据范围:286个地级市(包括直辖市)
数据年份:2002-2023年
样本数量:5439条
数据来源:政府工作报告
地区环境规制强度:基于各地区ZF工作报告中与“环境保护”相关词汇的频率,构建地级市ZF环境规制执行强度。各级ZF在每年年初“两会”召开期间向大会报告过去一年的工作成绩及未来的工作计划,报告在形成过程中凝聚了社会多方诉求和共识,对ZF当年工作起着决定性的指引作用。因此,ZF工作报告中对环境的重视程度能反映ZF当年环境治理力度以及治理政策的全貌。其中词汇为公布的15个:环境词汇、低碳、环境保护、空气、绿色、PM2.5、化学需氧量、二氧化碳、PM10、生态、排污、减排、污染、环保、二氧化硫、能耗等
数据说明:内含环境规制相关的15个词频明细、文本长度、文本词频总数
整理说明
从地方政府网爬取工作报告原始文件
将报告文本整理为面板数据
去除停顿词,利用python的jieba库进行精确模式和全模式分词,统计词频和
保留中英文、数字、标点符号,利用正则表达式统计15个词频
保留中英文、数字,统计全文文本总长度
保存文本词频总数、15个词频明细、文本长度
指标说明
一共24个指标,如下
行政区划代码 | 年份 | 城市 |
所属省份 | 文本总长度 | 仅中英文-文本总长度 |
文本总词频-全模式 | 文本总词频-精确模式 | 环保词频和 |
环境保护 | 环保 | 污染 |
能耗 | 减排 | 排污 |
生态 | 绿色 | 低碳 |
空气 | 化学需氧量 | 二氧化硫 |
二氧化碳 | PM10 | PM2.5 |