全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
3935 7
2010-10-25
我有一批数据,数据的变量有X1、X2、X3、X4,分别是连续型变量、二分类变量、有序多分类变量、无序多分类变量。现需产生随机数,问如何产生与原始数据结构相同(相关性相同、同是连续和分类变量)的随机数呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-10-25 23:36:06
1# 贾伟娜

My opinion:

That is hard.
It is almost impossible to consider the entire factors simultaneously in the model. You may want to simplify your model for a justified simulation.

JingJu
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-10-26 02:13:26
虽然产生随机数有很多种方法,但不过我想不论是简是繁大概大都需要从最基本的套订公式开始,也就是:
1。选定一个你所需要的随机数从哪一种分布来获得:通常有:ranbin, rancau, ranuni或rand等等。
2。然后,你可以选定带有种子的(ranbin, rancau, ranuni),或不带种子的(rand('UNIFORM‘))SAS语句。
3。然后,你可以选定可控范围内(rn3=1+int(rand('UNIFORM')*90);*range: 1-90;)或非控范围内(randnum=rand('UNIFORM'))取值。
4。最后,可以根据你想要的简繁程度和具体的需要,选定写出一个或多个或混合的随机数公式去控制一个变量或多个变量。
5。最后,察看你的随机数字的结果是否符合你的需要。
下面是几个简短的公式应用范例,根据你具体个人的需要可以加以修改!
data case;
   retain Seed_1 Seed_2 Seed_3 45;
   n=2000;
   p=.2;
   do i=1 to 10;
      call ranbin(Seed_1,n,p,X1);
      call ranbin(Seed_2,n,p,X2);
      X3=ranbin(Seed_3,n,p);
      if i=5 then
         do;
            Seed_2=18;
            Seed_3=18;
         end;
      output;
   end;
run;

DATA DICE(KEEP=SUM) OUTCOMES(KEEP=OUTCOME);
     DO ROLL=1 TO 10000;                   *** roll the two dice 10,000 times.;
        OUTCOME1=1+INT(6*RANUNI(123));     *** outcome from rolling the first dice;
        OUTCOME2=1+INT(6*RANUNI(123));     *** outcome from rolling the second dice;
        SUM=OUTCOME1+OUTCOME2;             *** sum up the two outcomes.;
        OUTPUT DICE;                       *** save the sum.;
        OUTCOME=OUTCOME1; OUTPUT OUTCOMES; *** save the first outcome.;
        OUTCOME=OUTCOME2; OUTPUT OUTCOMES; *** save the second outcome.;
     END;
RUN;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-10-26 08:31:12
贾伟娜 发表于 2010-10-25 23:18
我有一批数据,数据的变量有X1、X2、X3、X4,分别是连续型变量、二分类变量、有序多分类变量、无序多分类变量。现需产生随机数,问如何产生与原始数据结构相同(相关性相同、同是连续和分类变量)的随机数呢?
Why not use your real data to sample it. This will guarantee the same data structure.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-10-26 08:36:25
2# jingju11
这个我也考虑了很久,其实我要产生的随机数据库满足两个条件即可:1、随机数据库的总体相关性和原始数据库一致,或者检验无差异2、随机数据也是连续变量、二分类变量、有序多分类、无序多分类的数据结构。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-10-26 08:39:02
4# bobguy
我不知如何操作,请您进一步指点,或者写个CODE。谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群