6.0版更新说明:
1.根据2024年鉴整理,数据更新至2023年
2.新增指标,当前214个指标
5.0版更新说明:
数据更新至2022年
4.2版更新说明:
1.更新2021年部分指标数据
4.0版更新说明:
1.数据更新至2021年
2.调整部分旧指标
3.新增指标,当前190个指标
3.0版更新说明:
1.数据更新至2020年
2.调整部分指标,当前174个指标
2.4版更新说明:
1.更新部分缺失值
2.将数据转为平衡面板
3.填补升级。内含原始版本、线性插值、ARIMA填补三个版本数据
相关数据:世界各国数据库,中国省级数据库,中国县域数据库,中国城市建设数据,中国市辖区数据库
一、数据介绍数据名称:中国城市数据库
数据来源:中国城市统计年鉴1991-2024年、地方统计局
数据年份:[url=]1990-2023年[/url]
数据范围:300个地级市(包括直辖市)
样本数量:平衡面板10200条(300*34=10200)
更新时间:2025年2月,当前最新6.0版
二、整理方法第一,识别年鉴。利用NLP算法识别《中国城市统计年鉴》,并转为面板数据
第二,完善数据。对比主流数据库、地方统计局,进一步完善城市数据
第三,统一地区。匹配民政部编码,统一使用2019年编码和地区名称
第四,统一单位。对不同单位的情况,进行单位换算
第五,人工验证。得到所有指标的面板数据,并人工抽样验证
第六,平衡面板。将非平衡面板转为平衡面板数据
第七,线性插值。利用线性趋势对中间缺失进行填充,得到线性插值版
第八,ARIMA填补。利用时间趋势,对剩余缺失进行预测,得到ARIMA填补版
最终,保留原始版本、线性插值版、ARIMA填补版