全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
888 0
2016-10-03
我的数据有这些列:
SYMBOL TIME PRICE

现在想把相同SYMBOL和PRICE,又在五秒钟之内的项合并,也就是说假设有这些项:
AA 9:00:00 10
AA 9:00:03 10
AA 9:00:06 10
AA 9:00:07 12
BB 9:00:00 30

合并之后只有第二行会被去掉,也就是:
AA 9:00:00 10
AA 9:00:06 10
AA 9:00:07 12
BB 9:00:00 30


我试着用以下代码(数据集名称为trade):
data tempct;
  set trade;
run;

data trade;
  set tempct;
  time1=intnx("SECOND", time, -5, "SAME");
  lagsymbol=lag(symbol);
  lagprice=lag(price);
  lagtime=lag(time);            
  if symbol = lagsymbol & lagtime >= time1 & price = lagprice  then
    do; no=_n_; modify trade point=no; remove; end;
run;


但是得到的结果却是:
AA 9:00:00 10
AA 9:00:07 12
BB 9:00:00 30

第三项也被去掉了。。。应该是因为lagtime并不能得到五秒内的项被去掉之后新的前一项的time。我试了试其他方法,得到的结果更差。。。请问各位大大,有没有办法实现我对数据集的操作目标呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群