全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
3119 8
2015-07-04
正在做临床试验数据的模拟, 由于每周的数据都要满足一个缺失率, 并且每个试验组的缺失率也不一样, 以矩阵的形式用PROC IML存储在一个数据集里了, 目前我想到的方法是一周一周的用RANUNI等概率随机产生一定数量的随机数, 删除试验对象, 但感觉很笨. 考虑过PROC SURVEYSELECT, 但用每周来分层的话没有办法设定每个试验组不一样的缺失率. Google无果. 想请教各位大神SAS里面有没有这样的PROC步或者专门的模块可以一步达成的?
感觉表达的不够简洁, 其实就是我有一个完整的数据集, 然后想抠掉一些值让它们缺失, 缺失率矩阵长成酱紫:

missing rate
             wk1  wk2  wk3  wk4  wk5 wk6
group1 0.01 0.01 0.02 0.04 0.04 0.06
group2 0.02 0.02 0.03 0.05 0.06 0.08
group3 0.02 0.03 0.03 0.04 0.05 0.05

缺失的模式是单调的, 缺了第i周的数据, 之后的数据也全部缺失, 也就是酱紫:

     id  wk1  wk2  wk3 wk4  wk5  wk6
1001 2.65 3.08 3.14      .       .       .
1002 5.76 4.54 3.98 4.06 3.51 3.42
1003 4.53       .       .       .       .       .

我考虑的办法是先抽第一周缺失的人, 把他们删掉, 再在剩下的数据集里抽第二周缺失的人, 再删掉, 继续抽第三周, 以此类推.

这个问题应该有大牛曾经做过, 求大家畅所欲言~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-7-5 12:11:52
for group 1, both week 1 & 2 are missing 1%. Since missing at w1 has to be missing at w2, so, there are no additional missing at week2. is it correct?
JingJu
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-7-5 12:54:36
jingju11 发表于 2015-7-5 12:11
for group 1, both week 1 & 2 are missing 1%. Since missing at w1 has to be missing at w2, so, there  ...
correct.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-7-5 13:08:04
wodematlab 发表于 2015-7-5 12:54
correct.
say your data HAVE like:
ID grp wk1...wk6
1001 1 ......
1023 2 .......
1821 3 .......
1825 2 .......
code can be:
复制代码
JingJu
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-7-6 06:11:40
jingju11 发表于 2015-7-5 13:08
say your data HAVE like:
ID grp wk1...wk6
1001 1 ......
AMAZING! Thank you so much!!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-7-7 02:58:21
jingju11 发表于 2015-7-5 13:08
say your data HAVE like:
ID grp wk1...wk6
1001 1 ......
Is it possible to modify these lines to make them a non-monotone missing simulation? I tried but failed.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群