全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
28675 39
2014-01-03
最近需要用到sas来对我的一个数据进行1:1抽样,我在网上找了些资料看,没怎么看懂,于是自己想了一个思路来编写这个抽样程序,现分享给大家。
首先,数据库js如下,含有唯一变量ID,需要匹配的变量 shcool、grade、class和age,case是定义变量,1是病例,0是对照。抽样要求school、grade、class要相同,age相差不超过2岁。
QQ截图20140103103257.png
先说我的思路,首先是生成病例库和对照库, 然后依次从病例库中抽选1条,然后按照条件从对照库选择符合的样本组成待抽选库,然后从这个待抽选库中随机抽选1条,最后把抽出的这条从对照库中剔除,然后重复上述过程直到每条病例都匹配完成,最后合并抽出来的样本。
代码如下:
复制代码
最后,说说程序缺陷,首先是运行效率低,因为是循环语句反复生成数据库,病例较多时,运行肯定慢; 其次未考虑到匹配未成功的情况;第三,程序还是有点啰嗦。 仅供参考。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-1-4 05:13:37
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-3-14 14:33:13
建议你数据还是直接上传比较好,截图感觉不太方便使用
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-4-28 18:53:00
为何跑完程序出来的总库case和control并不是1:1
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-4-28 22:14:11
复制代码

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-4-29 09:27:13
jeozu 发表于 2014-4-28 22:14
大侠,你这个代码主要是匹配,但不是随机的。不能用来抽样。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群