全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
1457 0
2011-06-14
以下代码是从BaseDs 数据集中随机抽取出样本大小为SampSize 的子数据集。
有人可以用严格的概率计算证明以下命题吗?
每个观测被抽取的概率为 样本大小/总观测数(即subset数据集大小/BaseDs数据集大小)。

data work.subset(drop = ObsLeft SampSize);
SampSize = 10;
ObsLeft = TotObs;
do while(SampSize > 0 and ObsLeft > 0);

PickIt + 1;

if ranuni(0) < SampSize/ObsLeft then

do;

set  BaseDs point = PickIt

nobs = TotObs;

output;

SampSize = SampSize - 1;

end;

ObsLeft = ObsLeft - 1;
end;
stop;
run;

-------------------------------------------------------------------------------------------------------------------------------------------
本人的一些想法:以上代码算法是模拟抽签概率得出的:
                              记BaseDs数据集大小为T,记抽样大小SampSize为S。
                              则等价的情形为:一共有T个人,各人按顺序从T张彩票中抽取一张,T张彩票中有S张为中奖彩票。
则每个人抽中彩票的概率均为S/T。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群