请教各位前辈:数据删除的问题?
有2个数据集,aa和bb,在aa数据集中删除与bb数据集相同的观测。
data aa;
input a;
cards;
12345
11111
22222
23456
;
run;
data bb;
input b;
cards;
33333
11111
22222
;
run;
proc sql;
create table c as
select * from aa
where not exists
(select * from bb where
aa.a=b );
quit;
问题是:在aa数据集中有千万条观测,bb数据集也有万条,用上面的方法速度非常慢,请教还要什么好方法吗?
谢谢!!