全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
1616 2
2011-08-29
我想对一组数据进行重取样,经查阅资料发现,有两种方法都可以,例子如下:
data a;
input lnr est;
datalines;
-0.938694141 0.357124952
-1.666190729 0.208132394
-1.386294361 0.433413078
-1.456443549 0.020314413
-0.219141086 0.051951777
-0.958122041 0.009905266
-1.633775838 0.227009675
0.012020601     0.004006962
-0.471746036 0.056977124
-1.401210139 0.075421726
-0.340849646 0.012525134
0.446634682     0.534162172
-0.017341874 0.071635117
;
run;
proc surveyselect data=a
        out=outboot
        seed=30459584
        method=urs
        samprate=1
        outhits
        rep=1000;
  run;
data boots;
  do sampnum=1 to 1000;
    do i =1 to nobs;
      x=round(ranuni(0)*nobs);
     set A nobs=nobs point=x;
      output;
     end;
    end;
stop;
run;
现在的问题是:
1,这两种取样方法是否有什么差别?
2,如何在第一种方法中像第二种方法一样,在新生成的数据集中加入一列名为i的数列,i为1,2,3,4...随着重复次数而循环 (可以看第二种方法产生的数据**对我的问题更清楚哈哈!)求各位高人出手相助!!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2011-8-29 21:00:15
以下回答是个人见解,仅供参考
1.seed 不一样,方法一的seed确定后每一次运行的抽样结果都一样,方法二每次运行结构会不一样.当然你也可以利用proc sql进行抽样.背后的机理的一样的.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-8-29 21:04:47
2,如何在第一种方法中像第二种方法一样,在新生成的数据集中加入一列名为i的数列,i为1,2,3,4...
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群