中国
2771个县级行政区的
月度CO₂排放数据(2013–2021)
传统自上而下(Top-down)的县级CO₂排放估算方法过度依赖单一夜间灯光总亮度作为工具变量,默认省内所有区域CO₂排放与灯光亮度呈正相关,忽略了区域异质性(如产业结构升级、减排技术应用导致的碳排放与经济增长脱钩现象)。
现有县级排放数据集存在时空分辨率不足(如时间跨度短、非月度数据)或校准方法缺陷(如夜间灯光数据连续性校正导致“持续增长偏差”)。
本研究提供中国2771个县级行政区的月度CO₂排放数据(2013–2021),为县级“双碳”战略实施提供高精度基础数据。方法可推广至全球其他地区,支持精细化减排政策制定。
数据生成方法
工具变量构建流程
步骤1:省级CO₂排放数据(CEADS)与多维特征变量(灯光、社会经济指标)训练混合回归模型。
步骤2:模型输出县级“潜在排放预测值”作为新工具变量,其与省级排放相关性优于夜间灯光总亮度。
步骤3:以新工具变量为权重,通过自上而下算法分配省级排放至县级。
不确定性控制
模型误差通过RMSE量化(0.06),避免宏观统计数据与微观数据聚合偏差。
数据验证与对比
与传统方法对比
Chen et al.的数据库在相似CO₂排放水平的县中,出现产业结构比例矛盾(如工业占比差异显著但排放估值相近),而本研究结果符合经济逻辑(见图6)。
时空分布特征
排放呈现东高西低、核心城市集聚模式(见图3–4),且月度波动反映季节性经济活跃度变化。
数据信息
本研究共获取了中国2771个县级行政区2013–2021年的月度二氧化碳排放数据记录。数据单位为百万吨,数据格式xlsx,共计299269条数据。
此外,我们还提供了数据计算过程的全部文件与代码。具体包括:
- 文件"country_x_20241118_02.xlsx":收录了37项社会经济特征指标,用于反映潜在影响因素; 
- 文件"typeC20_catmodel_1109_3p01joint_scaler.pkl":包含特征变量标准化处理的代码; 
- 文件"country_pred.py"和"country_pred.pdf":提供县级工具变量预测的代码实现; 
- 文件"pre_model_weights.h5":存储预测模型的权重参数,这些参数用于计算输入数据的线性变换和非线性激活函数,包含模型中所有可训练参数(如各层神经元间的连接强度及各层神经元的偏置项); 
- 文件"typeC20_catmodel_1108_3p01joint.cbm":定义预测模型的结构,包括数据流向、层级连接方式等架构信息(如网络层类型、神经元数量及激活函数等)。