正在做临床试验数据的模拟, 由于每周的数据都要满足一个缺失率, 并且每个试验组的缺失率也不一样, 以矩阵的形式用PROC IML存储在一个数据集里了, 目前我想到的方法是一周一周的用RANUNI等概率随机产生一定数量的随机数, 删除试验对象, 但感觉很笨. 考虑过PROC SURVEYSELECT, 但用每周来分层的话没有办法设定每个试验组不一样的缺失率. Google无果. 想请教各位大神SAS里面有没有这样的PROC步或者专门的模块可以一步达成的?
感觉表达的不够简洁, 其实就是我有一个完整的数据集, 然后想抠掉一些值让它们缺失, 缺失率矩阵长成酱紫:
missing rate
wk1 wk2 wk3 wk4 wk5 wk6
group1 0.01 0.01 0.02 0.04 0.04 0.06
group2 0.02 0.02 0.03 0.05 0.06 0.08
group3 0.02 0.03 0.03 0.04 0.05 0.05
缺失的模式是单调的, 缺了第i周的数据, 之后的数据也全部缺失, 也就是酱紫:
id wk1 wk2 wk3 wk4 wk5 wk6
1001 2.65 3.08 3.14 . . .
1002 5.76 4.54 3.98 4.06 3.51 3.42
1003 4.53 . . . . .
我考虑的办法是先抽第一周缺失的人, 把他们删掉, 再在剩下的数据集里抽第二周缺失的人, 再删掉, 继续抽第三周, 以此类推.
这个问题应该有大牛曾经做过, 求大家畅所欲言~