全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
2336 2
2016-11-07
我有两个问题,第一个是关于合并数据集. 我有如下两个数据集, 1号数据集含有单个日期(如图20130118), 2号数据集包含从2012到2014年的Adj_close数据,我想将两个数据及合并之后,1号数据集有它含有的这个日期的Adj_close数据.   
1. 20161107025128.png
2. 20161107025048.png

但是我用下列code合并的时候,总是不成功以及报错, 合并出来的3号数据集只有日期,没有Adj_close数据.
复制代码
ERROR: BY variables are not properly sorted on data set WORK.AXP.
3. 20161107025728.png
假设我这一步成功,我将会计算Adj_close 和bid_price的差,如果这个差小于一定数值的话,我将会删除这个数据集. 在这里我只会根据observation数量删除,而不会根据特定的要求删除,所以希望大家可以帮我一下,给我些建议.

如果各位有更好的方法,可以不用合并数据集,直接计算两个值得差然后存入1号数据集,并根据这个差的大小去判断是否删除1号数据集,请直接忽略合并数据集的问题. 谢谢各位了


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-11-7 12:36:43
数据类型不一样吧,没有使用in 变量
我知道用proc sql 很容易实现。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-11-7 14:52:29
我觉得应该用proc sql 里面的有重复项的合并来做,毕竟第一个数据集是单一的时间,是重复的~~~
proc sql;
create c as select a.date,a.bid_price,b.date,b.adj_close
from a full join b
on a.date=b.date;
quit;
a,b分别代表上面的两个表
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群