全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管文库(原现金交易版)
1369 0
2022-05-15
1990-2019年,包括299个城市 样本数量:30年平衡面板8970条(299*30=8970)  数据整理:来源本人

  


二、整理方法

第一,识别年鉴。利用NLP算法识别《中国城市统计年鉴》,并转为面板数据

第二,完善数据。对比主流数据库、地方统计局,进一步完善城市数据

第三,统一地区。匹配民政部编码,统一使用2018年编码和地区名称

第四,统一单位。对不同单位的情况,进行单位换算

第五,匹配位置。利用高德地图API,得到地区的经纬度

第六,人工验证。得到所有指标的面板数据,并人工抽样验证

第七,平衡面板。将非平衡面板转为平衡面板数据

第八,线性插值。利用线性趋势对中间缺失进行填充,得到线性插值版

第九,ARIMA填补。利用时间趋势,对剩余缺失进行预测,得到ARIMA填补版



附件列表

中国城市数据库2.4版-线性插值、ARIMA填补(平衡面板1990-2019年)

大小:76 Bytes

只需: RMB 38 元  马上下载

中国城市数据库2.4版-线性插值、ARIMA填补(平衡面板1990-2019年)

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群