全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
9747 3
2011-01-15
我有个超长的数据,我复制了个开头:


"V1"        "V2"        "V3"        "V4"        "V5"        "V6"        "V7"        "V8"
240        24        "HOCHSCHULREIFE"        NA        NA        NA        NA        "ANGESTELLTER"
60        70        "VOLKS-,HAUPTSCHULE"        NA        NA        NA        "MITTEL-, KLEINSTADT"        "BEAMT,RICHTER,SOLDAT"
210        64        "VOLKS-,HAUPTSCHULE"        NA        NA        NA        "VORORT GROSSSTADT"        "SELBSTAENDIGE"
120        49        "MITTLERE REIFE"        25        1        1        NA        "ANGESTELLTER"
180        62        "VOLKS-,HAUPTSCHULE"        NA        NA        NA        "LAENDL. DORF"        "ARBEITER"
NA        77        "VOLKS-,HAUPTSCHULE"        NA        NA        NA        "GROSSSTADT"        "ARBEITER"



我试着用alanysis -statistics-descriptive来求v2的median 和 mean,可是不知为啥不能移到analysis的窗口里,帮帮忙!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2011-1-15 03:14:22
你的原始资料需要重新整理一下,就可以用了(1。要将NA全都写成点,2。去掉没用的双引号,3。mean和median只能用于V1和V2等数字运算,不能用于字母或符号,V4-V6因为只有唯一一个有效数字,也就无需作mean和median运算了,4。有两个proc可以用于计算mean和median:proc means 和proc summary,可以选用其中一个,请看我的SAS程序):
data a;
   input V1 V2 V3 $19. V4 V5 V6 V7 $20. V8 $20.;
cards;
240 24 HOCHSCHULREIFE      . . .                     ANGESTELLTER
060 70 VOLKS-,HAUPTSCHULE  . . . MITTEL-, KLEINSTADT BEAMT,RICHTER,SOLDAT
210 64 VOLKS-,HAUPTSCHULE  . . . VORORT GROSSSTADT   SELBSTAENDIGE
120 49 MITTLERE REIFE     25 1 1 ANGESTELLTER
180 62 VOLKS-,HAUPTSCHULE  . . . LAENDL. DORF        ARBEITER
  . 77 VOLKS-,HAUPTSCHULE  . . . GROSSSTADT          ARBEITER
;
proc print data=a;
proc summary nway data=a;
   output out=b(drop=_freq_ _type_) mean(v1)=mean_v1 mean(v2)=mean_v2
          median(v1)=median_v1 median(v2)=median_v2;
proc means nway data=a noprint;
   output out=b(drop=_freq_ _type_) mean(v1)=mean_v1 mean(v2)=mean_v2
          median(v1)=median_v1 median(v2)=median_v2;
proc print data=b;run;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-1-15 11:18:36
那个$是做什么用的?为什么带这个符号的后面要有个点?
我这是第一次用这个软件,所以一开始看到要手动写程序就特头疼~然后我发现用那个analysis可以像spss一样简单方便画图我就特高兴,可是到median这儿就不那么好办了,为什么不用这个呢?我周一到学校去试试你写的,看看我手动能弄出啥来
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-1-20 02:40:06
$就是用于解读字符串char的,点就代表missing value,就相当于NA,但SAS中不认NA,只认点。你会SPSS,那一定也能学会SAS,都是4G语言,不是很难学!用熟了,就会觉得容易了!只是用正版的,一定要花很多钱来买相应年限的使用权。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群