Hi 在编程的过程中出现一个疑问问题!!希望大家帮忙答疑哇!!
proc sql;
create table retvar as
select a.*, b.aret, b.resp from rerr as a left join resp_t as b
on a.firmi = b.firmi and a.datadate = b.datadate;
quit;
这个非常普通的程序 运行之后出现好几倍的 重复观测值!!本来 rerr数据集一个大约50万个observation,resp_b 大约10万个observation,生成的数据集retvar一共竟有几千万个 observation!!这是怎么产生的??!!我之后使用了proc sort data =retvar nodupkey;
by firmi datadate peer;
run;
去掉了90%的重复值!!
童鞋们 我以前也遇到过类似的问题 一直不知道问题出在哪里,还请告知其中原理哇!!不胜感激!!