全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
6834 13
2013-03-13
请各位高手指教,困扰了我2天了,找不到什么好方法。数据实例:
  task_id                     date         var1    var2    var3
  2010-11-30        2012-3-31      aaa      bbb     ccc
  2011-05-31        2012-3-31      aaa      bbb     ccc
  2011-08-31        2012-3-31      aaa      eee     ccc
  2012-03-31        2012-3-31      aaa      bbb     ccc
具体问题:“task_id”为上报日期,本来应当一个月上报一次,也就是从2010年11月至今共计应当有17条,但是由于上报数据缺失,现在想将缺失的数据补齐。
补齐规则为:下一个月的数据除了task_id延后一月其他都与上月相同。例如
   task_id                    date          var1    var2    var3
2010-11-30        2012-3-31      aaa      bbb     ccc
  2010-12-31        2012-3-31      aaa      bbb     ccc
         ..........
2011-08-31        2012-3-31      aaa      eee     ccc
  2012-09-30        2012-3-31      aaa      eee     ccc
        .........
2012-03-31        2012-3-31      aaa      bbb     ccc
另:数据量非常大,最好是批量解决的办法。。。。(好像是废话)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-3-13 10:21:33
按task_id排序,再使用retain语句就可以解决问题啦。搜搜论坛上有如何补全missing value的sample code。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-3-13 10:43:35
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-3-13 11:31:17
首先感谢二位的指导。我找了找论坛上的missing  value处理,还没有太明白,呵呵!
可乐兄的方法我试了,对于我的例子来说是可以的;可能我的例子有点过于简化,现在附上一部分经过修改的数据,请各位再帮忙想想办法啊!!!
task_iddatevar1var2var3

2007/10/31

2008/12/31

366010

6506263N200700425

2009/5/29

2009/10/31

2009/12/31

2316010

HO650720000200900021

2012/5/13

2011/2/28

2011/4/30

5882654

544126

2015/12/21

2011/2/28

2011/4/30

5882654

6441040

2015/12/21

2007/5/31

2007/7/31

593722

1028129

2008/1/31

2007/9/31

2007/12/31

593722

1028129

2008/1/11

2007/5/31

2007/7/31

593722

1028129

2007/12/8

2007/5/31

2007/7/31

593722

1028236

2007/11/12

2007/5/31

2007/12/31

593722

2023509

2007/9/25

2007/5/31

2007/7/31

593722

6054504

2007/10/9

2007/5/31

2007/7/31

593722

6054721

2007/10/10

2007/5/31

2007/7/31

593722

6054808

2007/10/11

2007/5/31

2007/7/31

593722

6058092

2007/10/26

2007/5/31

2007/8/31

593722

6060651

2007/11/8

2009/11/30

2010/1/31

593722

9500660

2012/12/31

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-3-13 12:10:23
wanzionline 发表于 2013-3-13 11:31
首先感谢二位的指导。我找了找论坛上的missing  value处理,还没有太明白,呵呵!
可乐兄的方法我试了,对 ...
这个没多大区别吧,就是多了一些重复的记录,可是不管怎样,只要是缺失的,都会以最近一次的月份数值来补全。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-3-13 12:13:17
楼上 可乐 的办法不是挺好的吗? 具体有什么不能实现的吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群