我想对一组数据进行重取样,经查阅资料发现,有两种方法都可以,例子如下:
data a;
input lnr est;
datalines;
-0.938694141 0.357124952
-1.666190729 0.208132394
-1.386294361 0.433413078
-1.456443549 0.020314413
-0.219141086 0.051951777
-0.958122041 0.009905266
-1.633775838 0.227009675
0.012020601 0.004006962
-0.471746036 0.056977124
-1.401210139 0.075421726
-0.340849646 0.012525134
0.446634682 0.534162172
-0.017341874 0.071635117
;
run;
proc surveyselect data=a
out=outboot
seed=30459584
method=urs
samprate=1
outhits
rep=1000;
run;
data boots;
do sampnum=1 to 1000;
do i =1 to nobs;
x=round(ranuni(0)*nobs);
set A nobs=nobs point=x;
output;
end;
end;
stop;
run;
现在的问题是:
1,这两种取样方法是否有什么差别?
2,如何在第一种方法中像第二种方法一样,在新生成的数据集中加入一列名为i的数列,i为1,2,3,4...随着重复次数而循环 (可以看第二种方法产生的数据**对我的问题更清楚哈哈!)求各位高人出手相助!!!