抽样方法可分为随机抽样(亦称为机率抽样 Probability Sampling)和非随机抽样(亦称为非机率抽样 Non-Probability Sampling)两大类,这两类的抽样方法都被经常地使用。随机抽样是指按照机率原则,从母体中抽取一定数目的单位元作为样本进行观察,随机抽样使母体中每个单位都有一定的机率被选入样本,从而使根据样本所做出的结论对母体具有充分的代表性。非随机抽样则是以方便为出发点或根据研究者主观的判断来抽取样本。非随机抽样主要依赖研究者个人的经验和判断,它无法估计和控制抽样误差(sampling error),亦无法用样本的量化数据来推断母体。
在所有抽样方法中,属分层抽样(Stratified Sampling)法所应用的范围最广与最多。它是先将母体所有单位按某些重要因素进行分类(层),然后在各类(层)中采用简单随机抽样(simple random sampling)或系统抽样(system sampling)方式抽取样本单位。分层抽样比简单随机抽样和系统抽样更为精确,能够通过对较少的抽样单位的调查,得到比较准确的推断结果,特别是当母体较大、内部结构复杂时,分层抽样常能取得令人满意的效果。同时,分层抽样在对母体推断的同时,还能获得对每层的推论。
DATA _NULL_;
RETAIN SEED 83624;
DO I=1 TO 1000;
SERIAL=I;
LAYER=CEIL(8*RANUNI(SEED));
VOLUME=CEIL(100*RANUNI(SEED));
FILE INMAST;
PUT @1 SERIAL Z4. @8 LAYER 1. @11 VOLUME 3.;
END;
B. 读入字段素描档=>产生SAS字段格式档
DATA _NULL_;
INFILE INFIELD;
INPUT FIELD $7-12 F 4-5 S 13-17 TYPE $6;
IF TYPE='9' THEN KK=FIELD||' '||COMPRESS(F)||'.';
ELSE KK=FIELD||' $'||COMPRESS(F)||'.';
FILE SASFORM;
PUT KK 1-20;
DATA SAMPS(KEEP=&LAYER SAMPS RAN);
SET NOUT ; RETAIN NSAMP 1 ;
ARRAY RA{500} RAN1-RAN500 ;
IF MARK=1 THEN
DO J=1 TO SAMPS; RAN=J ; OUTPUT ; END ;
ELSE DO ;
DO UNTIL(NSAMP=SAMPS+1 ] NSAMP=_FREQ_+1) ;
RAN=CEIL(_FREQ_*RANUNI(1994)) ;
IF NSAMP>1 THEN
DO J=1 TO NSAMP-1 ;
IF RAN=RA{J} THEN GOTO NEXT;
END ;
OUTPUT ; RA{NSAMP}=RAN ; NSAMP=NSAMP+1 ;
NEXT:END;
NSAMP=1 ;
END ;