全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管文库(原现金交易版)
402 0
2025-05-07

贵州省县域经济社会数据贵州省县域统计年鉴面板数据2000-2023年(插值无缺失版)


一、数据背景

本数据基于《中国区域经济统计年鉴》《中国县域统计年鉴》等官方资料,系统整合了2000-2023年县级行政单位的经济、人口、农业、教育、卫生、投资、能源等80项指标。为确保数据连续性与可用性,采用线性插值与ARIMA模型进行缺失值填补,转化为完整的平衡面板数据,同时保留原始数据版本,满足不同研究需求。



二、数据概况
  • 数据名称县域经济人口农业财政投资社会发展综合数据库

  • 数据范围标题省份的县域数据(县域/撤县市设立的区,不含主城区)

  • 时间范围2000-2023年

  • 数据来源:《中国区域经济统计年鉴》《中国县域统计年鉴》

  • 数据版本原始版、线性插值版、ARIMA填补版

  • 整理方式:NLP识别+单位统一+地区统一+人工验证+平衡面板处理



三、数据指标

数据共包含80个核心指标,覆盖以下主要领域:

类别

指标示例

行政与人口

年份、省份、城市、区县、区县代码、年末总人口、户籍人口、乡村人口

经济发展

地区生产总值(GDP)、第一产业增加值、第二产业增加值、工业增加值、第三产业增加值

居民收入

城镇居民人均可支配收入、农村居民人均可支配收入、人均地区生产总值

财政金融

地方财政一般预算收入与支出、城乡居民储蓄存款余额、金融机构贷款余额

农业生产

农作物总播种面积、粮食总产量、农林牧渔业总产值、农业机械总动力

工业投资

规模以上工业企业数、工业总产值、固定资产投资完成额

教育卫生

普通小学、普通中学、职业教育学校数量及在校人数,医院床位数、卫生技术人员数

资源环境

社会用电量、废气污染物排放量、公共图书馆藏书量、体育场馆数量


(完整指标列表详见下图展示)



四、整理与填补方法
  • 年鉴识别与面板转化

    基于NLP算法自动识别《中国区域经济统计年鉴》《中国县域统计年鉴》表格数据,转化为标准化面板格式。

  • 数据完善与核验

    对比主流数据库及地方统计局数据,对异常或缺失数据进行补充与修正,统一地区代码(2019版民政部标准),统一单位。

  • 人工抽样验证

    在算法处理基础上,人工抽样核验部分数据,确保数据准确性和一致性。

  • 平衡面板构建

    剔除缺失严重的县区样本,确保每个县区在2000-2023年期间均有完整数据记录。

  • 缺失值填补处理



  • 线性插值版:对年份中间的零散缺失值采用线性趋势插补。

  • ARIMA填补版:对剩余缺失值基于时间序列趋势预测填补,提高数据连续性和合理性。

  • 原始版:保留未填补前的原始数据,供自定义处理。


最终形成原始版、线性插值版、ARIMA填补版三套数据,供不同研究需求灵活选择。



五、参考文献

[1] 中国区域经济统计年鉴(历年)

[2] 中国县域统计年鉴(历年)

[3] 民政部《中华人民共和国行政区划代码》标准

[4] Brockwell, P. J., & Davis, R. A. (2016). Introduction to Time Series and Forecasting.


六、部分数据展示

WechatIMG2681.jpg






二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群