全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
1957 3
2019-11-06
有两个问题:
1. 我想对所有的数值型变量用标准差的方法筛选异常值,但是看了很多例子都是只对某一个变量进行筛选,我这里变量太多,没办法一个个手动输入。

用均值标准差的方法

proc means data=pmlr.Developnoprint;

   var _numeric_;(对所有数值型变量进行)

   output out=means(drop=_type_ _freq_)

          mean=M_DDABal(这个地方不知道怎么改,原文是这样的DDABal变量,但是我想把这个位置换位所有的数值型变量mean=M_ _numeric_???)

          std=S_DDABal;(同上)

run;

data _null_;

   file print;

   set pmlr.Develop(keep=DDABal);

   if _n_ = 1 then set means;

   if DDABal lt M_DDABal - 2*S_DDABal and not missing(DDABal) or

      DDABal gt M_DDABal + 2*S_DDABal then put  DDABal=;

run;(第二段程序也是这个变量引入的问题)




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2019-11-6 09:35:54
2。同样是异常值处理。

我对每个变量用了

proc univariate data=total;
var _numeric_;
run;

得到分位数图,想把类似于这样的变量删去,如何做到呢?就是只有99%和100%才会出现。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-11-6 09:35:55
3OC$FJ}T618%O)SZPAR@8.jpg 0C[{NI@FD2OZ_IL{V`7YS23.png
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-8-23 15:37:34
请问楼主是怎么解决第一个问题的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群