全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
1769 3
2012-08-01
各位大侠:现在有两个数据集,我想在第二个数据集中挑选出含有第一个数据集中变量a的所有观测,程序怎么写?变量a是第一个数据集中的变量,只有这一个变量;变量c,d是第二个数据集中的变量(第二个数据集中有上百万条数据)
a                    c               d
0101        0101        1000
0102        0101        200
0103        0101        2466
0104        0101        6788
0105        0101        1110
0106        0102        4355
0107        0102        5036
0108        0102        5717
0109        0102        6398
0110        0102        7078
0111        0102        7759
0112        0103        8440
0113        0103        9121
0114        0103        9802
0115        0103        10482
0116        0103        11163
0117        0103        11844
0118        0103        12525
0119        0103        13206
0120        0103        13886

也就是说,我现在要在第二个数据集中挑出含有0101-0120的所有观测;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-8-1 17:15:34
proc sql;
select a.a,b,c from a inner join b
on a.a=b.a;
quit;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-8-1 17:16:42
"第二个数据集中挑出含有0101-0120的所有观测" 是变量c 吗?还是d 也算的?排过序的话直接merge,不追求效率又比较简单易懂的用sql,追求效率的话用hash,追求实际效率的话,还是merge吧……
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-8-1 21:13:50
要不用merge也行的
用下in= 变量~~~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群