全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
16067 15
2015-09-17
数据集中日期不连续的,有断层。比如:
2014-4-5    123
2014-4-6    234
2014-4-8     456
2014-4-10   345



现在需要补齐缺失的日期,补全后数据集为

2014-4-5    123
2014-4-6    234
2014-4-7
2014-4-8     456
2014-4-9
2014-4-10   345




数据集有近6万个数据量,有没有方法可以实现这个过程(R语言),求回答。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-9-17 15:33:23
你的日期数据格式是哪种
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-9-17 15:50:01
万人往LVR 发表于 2015-9-17 15:33
你的日期数据格式是哪种
就是as.Date()函数处理之后的格式
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-9-17 16:19:09
> library(lubridate)
> x<-ymd("2010-01-01")
> y<-ymd("2010-03-30")
> z<-as.numeric(y-x)
> DATE<-x+days(0:z)
> x
[1] "2010-01-01 UTC"
> y
[1] "2010-03-30 UTC"
> DATE
[1] "2010-01-01 UTC" "2010-01-02 UTC" "2010-01-03 UTC" "2010-01-04 UTC" "2010-01-05 UTC" "2010-01-06 UTC" "2010-01-07 UTC" "2010-01-08 UTC"
[9] "2010-01-09 UTC" "2010-01-10 UTC" "2010-01-11 UTC" "2010-01-12 UTC" "2010-01-13 UTC" "2010-01-14 UTC" "2010-01-15 UTC" "2010-01-16 UTC"
[17] "2010-01-17 UTC" "2010-01-18 UTC" "2010-01-19 UTC" "2010-01-20 UTC" "2010-01-21 UTC" "2010-01-22 UTC" "2010-01-23 UTC" "2010-01-24 UTC"
[25] "2010-01-25 UTC" "2010-01-26 UTC" "2010-01-27 UTC" "2010-01-28 UTC" "2010-01-29 UTC" "2010-01-30 UTC" "2010-01-31 UTC" "2010-02-01 UTC"
[33] "2010-02-02 UTC" "2010-02-03 UTC" "2010-02-04 UTC" "2010-02-05 UTC" "2010-02-06 UTC" "2010-02-07 UTC" "2010-02-08 UTC" "2010-02-09 UTC"
[41] "2010-02-10 UTC" "2010-02-11 UTC" "2010-02-12 UTC" "2010-02-13 UTC" "2010-02-14 UTC" "2010-02-15 UTC" "2010-02-16 UTC" "2010-02-17 UTC"
[49] "2010-02-18 UTC" "2010-02-19 UTC" "2010-02-20 UTC" "2010-02-21 UTC" "2010-02-22 UTC" "2010-02-23 UTC" "2010-02-24 UTC" "2010-02-25 UTC"
[57] "2010-02-26 UTC" "2010-02-27 UTC" "2010-02-28 UTC" "2010-03-01 UTC" "2010-03-02 UTC" "2010-03-03 UTC" "2010-03-04 UTC" "2010-03-05 UTC"
[65] "2010-03-06 UTC" "2010-03-07 UTC" "2010-03-08 UTC" "2010-03-09 UTC" "2010-03-10 UTC" "2010-03-11 UTC" "2010-03-12 UTC" "2010-03-13 UTC"
[73] "2010-03-14 UTC" "2010-03-15 UTC" "2010-03-16 UTC" "2010-03-17 UTC" "2010-03-18 UTC" "2010-03-19 UTC" "2010-03-20 UTC" "2010-03-21 UTC"
[81] "2010-03-22 UTC" "2010-03-23 UTC" "2010-03-24 UTC" "2010-03-25 UTC" "2010-03-26 UTC" "2010-03-27 UTC" "2010-03-28 UTC" "2010-03-29 UTC"
[89] "2010-03-30 UTC"
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-9-17 16:45:42
jinkelazzz 发表于 2015-9-17 16:19
> library(lubridate)
> x y z DATE x
[1] "2010-01-01 UTC"
我的数据量比较大,而且中间的缺失量比较多,这个方法可能还是要先识别不连续时间的开始与结束,能不能有直接实现这个过程的函数或者其他方法?谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-9-17 16:50:47
chloe0521 发表于 2015-9-17 16:45
我的数据量比较大,而且中间的缺失量比较多,这个方法可能还是要先识别不连续时间的开始与结束,能不能有 ...
你就列出头尾不就好啦。中间的不都是你要的么
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群