PROC SURVEYSELECT一般形式+分层等比例随机抽样+分层不等比例 |
在医学研究中大多数情况无法对所有整体进行全面研究,往往从中抽取一个具有代表性的样本进行分析,而随机抽样是是确定样本时一个应用最为普遍也是最为简单的方法。
包括:单纯随机抽样(simple random sampling)、系统抽样(systematic sampling)、分层抽样(stratified sampling)、整群抽样(clustering sampling),相关概念见有关书籍,在这里利用SAS学习proc surveyselect 过程的用法。
1、PROC SURVEYSELECT一般形式:
举例:建立数据集a含1000个数据:data a ;do i = 1 to 1000 ;output ;end ;run ;
1、简单无重复随机抽样,从中抽取100个数据:
proc surveyselect data = a method = srs n = 100 out= b seed = 25070419 ;run ;
2、简单随机抽样,按10%的比例抽取:
proc surveyselect data =a method=srs samprate=0.1 out=b seed=25070419;run ;
3、系统抽样:在 1000 个数据中每隔 10 个抽取 1 个:
proc surveyselect data = a method = sys sampsize =100 out = b seed = 25070416 ;run ;
2、分层等比例随机抽样举例:
3、分层不等比例抽样举例;
(1)手工设置抽样比例或者抽样数
(2)根据抽样表进行不等比例抽样