数据说明:
1.数据更新至2023年
2.数据填补方式优化
3.剔除较少区县
一、数据介绍
数据名称:中国县域数据库
数据范围:2708个区县
数据年份:2000-2023年
样本数量:2708县*24年=64992条
数据来源:《中国区域经济统计年鉴》、《中国县域统计年鉴》
数据整理:各指标存在不同程度缺失
更新时间:2025年3月,当前最新6.0版
相关数据:中国县城建设数据库
二、整理方法
第一,识别年鉴。利用NLP算法识别《中国区域经济统计年鉴》、《中国县域统计年鉴》,并转为面板数据
第二,完善数据。对比主流数据库、地方统计局,进一步完善县域数据
第三,统一地区。匹配民政部编码,统一使用2019年编码和地区名称
第四,统一单位。对不同单位的情况,进行单位换算
第五,人工验证。得到指标的面板数据,并人工抽样验证
第六,平衡面板。将非平衡面板转为平衡面板数据
第七,线性插值。利用线性趋势对中间缺失进行填充,得到线性插值版
第八,ARIMA填补。利用时间趋势,对剩余缺失进行预测,得到ARIMA填补版
最终,保留原始版本、线性插值版、ARIMA填补版
三、数据指标
共计80个指标,部分如下:
年份、省份、城市、区县、区县代码、行政区域土地面积、乡及镇个数、乡个数、镇个数、街道办事处个数、村民委员会个数、年末总户数、乡村户数、年末总人口、乡村人口、户籍人口数、年末单位从业人员、城镇单位在岗职工人数、乡村从业人员数、农林牧渔业从业人员数、年末第二产业单位从业人员、年末第三产业单位从业人员、农业机械总动力、固定电话用户、移动电话用户数、宽带接入用户数、地区生产总值、第一产业增加值、第二产业增加值、工业增加值、第三产业增加值、农业增加值、牧业增加值、人均地区生产总值、城镇单位在岗职工平均工资、城镇居民人均可支配收入、农村居民人均可支配收入、地方财政一般预算收入、各项税收、地方财政一般预算支出、城乡居民储蓄存款余额、年末金融机构各项贷款余额、出口额、实际利用外资金额、农作物总播种面积、常用耕地面积、机收面积、设施农业占地面积、农用机械总动力、粮食总产量、棉花产量、油料产量、肉类总产量、农林牧渔业总产值、规模以上工业企业数、规模以上工业总产值、城镇固定资产投资完成额、全社会固定资产投资、社会消费品零售总额、房地产开发投资、普通小学学校数、普通中学学校数、普通小学专任教师数、普通中学专任教师数、普通小学在校生数、普通中学在校学生数、中等职业教育学校在校学生数、医院、卫生院床位数、卫生技术人员、执业医师、各种社会福利收养性单位数、各种社会福利收养性单位床位数、全社会用电量、城乡居民生活用电量、废气中氮氧化物排放量、废气中烟尘排放量、工业废气中二氧化硫排放量、艺术表演场馆数、公共图书馆总藏量、体育场馆机构数