我想实现样本配对,要求是这样的:在相同年度中找行业相同,业绩相近的配对样本组。最好的结果是行业代码1相同,配对样本组的roa在样本roa的0.9至1.1之间;如果未找到配对样本,放宽行业即使用行业代码2相同,roa要求如上;如果还是找不到,不要行业限制,仅要求roa;如果最终还是找不到配对样本,取同行业(行业代码1)样本与配对样本roa相差的绝对值最小的三个样本作为配对样本。
我是用do语句来做的,思路是先选一个样本,按年度与配对数据集合并,再在这个数据集中用if语句实现配对。附件中是一个样本已按年度合并后的数据集,各项数据:股票代码stkcd、行业代码indu1(制造业取前两位)、行业代码indu2(全部都取第1位)、roa。
配对过程是这样的:我试着编写了以下程序,但运行后发现:找到满足条件的样本后,程序并未转至结尾,而是顺序执行后面的语句,由于配对条件是一个比一个条件松,因此最终似乎只留下最后一个条件的配对结果。如何使程序在找到满足条件的样本后即结束?请高手指点。
data m4; set m3;
if sindu=mindu and sindu1=mindu1 and  0.9*roa1<=roa2<=1.1*roa1 then do; where sindu=mindu  and  0.9*roa1<=roa2<=1.1*roa1;
 end;
else if sindu~=mindu and sindu1=mindu1 and 0.9*roa1<=roa2<=1.1*roa1 then do; where  sindu~=mindu and sindu1=mindu1 and 0.9*roa1<=roa2<=1.1*roa1;
end;
else if sindu~=mindu and sindu1~=mindu1 and 0.9*roa1<=roa2<=1.1*roa1 then do;  where  sindu~=mindu and sindu1~=mindu1 and 0.9*roa1<=roa2<=1.1*roa1;
end;
else do; where sindu=mindu and t1<4; end;/*t1是按roa差的绝对值排完序的序号*/
run;