贵州省县域经济社会数据贵州省县域统计年鉴面板数据2000-2023年(插值无缺失版)
一、数据背景本数据基于《中国区域经济统计年鉴》《中国县域统计年鉴》等官方资料,系统整合了2000-2023年县级行政单位的经济、人口、农业、教育、卫生、投资、能源等80项指标。为确保数据连续性与可用性,采用线性插值与ARIMA模型进行缺失值填补,转化为完整的平衡面板数据,同时保留原始数据版本,满足不同研究需求。
二、数据概况
- 数据名称:县域经济人口农业财政投资社会发展综合数据库 
- 数据范围:标题省份的县域数据(县域/撤县市设立的区,不含主城区) 
- 时间范围:2000-2023年 
- 数据来源:《中国区域经济统计年鉴》《中国县域统计年鉴》 
- 数据版本:原始版、线性插值版、ARIMA填补版 
- 整理方式:NLP识别+单位统一+地区统一+人工验证+平衡面板处理 
 
三、数据指标数据共包含80个核心指标,覆盖以下主要领域:
| 类别 | 指标示例 | 
| 行政与人口 | 年份、省份、城市、区县、区县代码、年末总人口、户籍人口、乡村人口 | 
| 经济发展 | 地区生产总值(GDP)、第一产业增加值、第二产业增加值、工业增加值、第三产业增加值 | 
| 居民收入 | 城镇居民人均可支配收入、农村居民人均可支配收入、人均地区生产总值 | 
| 财政金融 | 地方财政一般预算收入与支出、城乡居民储蓄存款余额、金融机构贷款余额 | 
| 农业生产 | 农作物总播种面积、粮食总产量、农林牧渔业总产值、农业机械总动力 | 
| 工业投资 | 规模以上工业企业数、工业总产值、固定资产投资完成额 | 
| 教育卫生 | 普通小学、普通中学、职业教育学校数量及在校人数,医院床位数、卫生技术人员数 | 
| 资源环境 | 社会用电量、废气污染物排放量、公共图书馆藏书量、体育场馆数量 | 
(完整指标列表详见下图展示)
⸻
四、整理与填补方法
- 年鉴识别与面板转化 - 基于NLP算法自动识别《中国区域经济统计年鉴》《中国县域统计年鉴》表格数据,转化为标准化面板格式。 
- 数据完善与核验 - 对比主流数据库及地方统计局数据,对异常或缺失数据进行补充与修正,统一地区代码(2019版民政部标准),统一单位。 
- 人工抽样验证 - 在算法处理基础上,人工抽样核验部分数据,确保数据准确性和一致性。 
- 平衡面板构建 - 剔除缺失严重的县区样本,确保每个县区在2000-2023年期间均有完整数据记录。 
- 缺失值填补处理 
 
最终形成原始版、线性插值版、ARIMA填补版三套数据,供不同研究需求灵活选择。
⸻
五、参考文献[1] 中国区域经济统计年鉴(历年)
[2] 中国县域统计年鉴(历年)
[3] 民政部《中华人民共和国行政区划代码》标准
[4] Brockwell, P. J., & Davis, R. A. (2016). Introduction to Time Series and Forecasting.
⸻
六、部分数据展示
 
 
 
