全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管文库(原现金交易版)
249 0
2025-06-10

6.0版更新说明:

  1.数据更新至2023年

  2.数据填补方式优化

  3.剔除较少区县


5.0版更新说明:

  1.数据更新至2022年

  2.剔除较少区县

4.0版更新说明:

  1.数据更新至2021年

  2.修复少部分地区代码错误

3.0版更新说明:

  1.数据更新至2020年

  2.剔除缺失较多的区县,转为平衡面板

  3.填补升级。内含原始版本、线性插值、ARIMA填补三个版本数据



一、数据介绍

数据名称:中国县域数据库

数据范围:2708个区县

数据年份:2000-2023年

样本数量:2708县*24年=64992条

数据来源:《中国区域经济统计年鉴》、《中国县域统计年鉴》

数据整理:各指标存在不同程度缺失

更新时间:2025年3月,[url=]当前最新6.0版[/url]

相关数据:中国县城建设数据库


二、整理方法

第一,识别年鉴。利用NLP算法识别《中国区域经济统计年鉴》、《中国县域统计年鉴》,并转为面板数据

第二,完善数据。对比主流数据库、地方统计局,进一步完善县域数据

第三,统一地区。匹配民政部编码,统一使用2019年编码和地区名称

第四,统一单位。对不同单位的情况,进行单位换算

第五,人工验证。得到指标的面板数据,并人工抽样验证

第六,平衡面板。将非平衡面板转为平衡面板数据

第七,线性插值。利用线性趋势对中间缺失进行填充,得到线性插值版

第八,ARIMA填补。利用时间趋势,对剩余缺失进行预测,得到ARIMA填补版

最终,保留原始版本、线性插值版、ARIMA填补版



附件列表
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群