全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
5001 2
2017-09-19
对统计分析不太懂,请大神指教。

有一个订单数据的时间序列,但是月份不是连续的。
比如,7月份和8月份客户那边订单了,但是9月份就没下订单,之后10月份又下订单了。

目的是想去做,基于时间序列的,未来订单数量的预测。
但是现在因为下订单的月份不是连续的,所以想看看,有没有办法基于已有的数据,来填补缺失月份的订单数量。

例如,有如下数据。6月份,7月份,9月份都有订单,但是8月份没有实际订单数量。

--------------------------
2017年6月份  200个订单数量
2017年7月份  500个订单数量
2017年9月份  300个订单数量
--------------------------

8月份没有订单数量不是有数据没有记入,而是8月份本来就没有订单数量。
但是因为想做未来订单数量的预测,所以想虚拟模拟出8月份的订单数量。

比如,把7月份和9月份的订单数量下调一部分,然后把那些下调的数据相加,并作为8月份的订单数量。
请问,上述方法是否可行?假如可行的话,需要用到什么函数?(最好是软件R相关的函数)。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-9-19 10:45:28
时间序列填补缺失值方法比较多,比如前向填充,后向填充,前后均值,整体均值,众数,样条插值都行,如果数据缺失不多的话,选一个都行。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-9-20 18:08:57
像这类数据很少的话,用普通的缺省值补充方法不太合适,如果数据多一点还可以,因为你一共四个数据,还要去预测下一期的值,这个缺省值起到的作用太大,可能不能的方法得到的结果差距会很大,所以你看看有没有16年的数据或者更早的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群