全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
2560 7
2010-04-12
悬赏 20 个论坛币 已解决
海量数据,发现其中有很多需要清理的,比如两行数据,其中有一些字段的值相等,这时取其中一行就行了。现在有上千对这样的数据,如何进行处理?最好说详细一点。
还有一个问题,按某列把数据分类之后,如何按分类项进行统计?
每个问题10分。新手,请大家指教。

最佳答案

lvjinghui 查看完整内容

data a : var1 var2 var3 x 1 y1 n1 x 1 y1 n2 x2 y2 n3 proc sort data=a; by var1 var2; run; data a1; set a1; by var1 var2 ; if first.var1; run; 按小类统计的话 by 分类变量就ok 啦 比如: proc logistic; by class var; class var1 var2; model y= x1 x2; run;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-4-12 08:29:33
data a :
var1   var2   var3
   x 1        y1         n1
   x 1        y1         n2
   x2        y2          n3
proc sort data=a;
    by var1 var2;
run;
data a1;
   set a1;
      by  var1 var2 ;
      if first.var1;
run;
按小类统计的话  by 分类变量就ok 啦
比如:
proc logistic;
   by class var;
   class var1 var2;
    model y= x1 x2;
run;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-4-12 08:34:52
也来学习学习。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-4-12 08:37:08
说的太笼统,最好能上传些样本数据
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-4-12 08:43:43
不知道你喜欢用哪一个软件,如果用SAS软件
解决的方法是指定行取数据,例如编程序中的INPUT语句中指定行号,例如 #3即取第三行的数据
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-4-12 08:45:14
可能我说的不太清楚吧。比如,一个人有三门成绩,对应了三行记录,我现在只要取这个人最高的一门成绩,三选一。如果有几千人该怎么办?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群