我有一个birth_data的数据集。里面的变量包括patient和age,一共有N个观测。现在我想要通过SAS产生一些模拟数据集。要求如下:
1)我有一个数据集outlier,从outlier里面抽取x%*N条数据。
2) 在birth_data随机抽取x%*N条数据,这些数据将被上一步中产生的模拟数据代替。随机抽取的次数为1000次,相应地,替代的次数也为一千次。这样可以得到1000个被抽取和替代后的birth_data的模拟数据集。
3) 得到的1000个模拟数据集以后,分别计算出这些模拟数据集中age的均值和方差,并且将这些均值和方差合并入格式如下的数据集中。
| Simulation degree | Simulation dataset order | mean | std |
0.1 | 1 | ….. | …… |
0.1 | 2 | ……. | ……. |
0.1 | 3 | …….. | ……. |
0.1 | …. | ….. | …… |
0.1 | 1000 | …… | ……. |