全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
1174 3
2013-09-25
现在有这样一个数据:

type         merch             count
百货类      百货商场A        10
百货类      百货商场B        9
百货类      百货商场C        5
超市类      超市A              10
超市类      超市B                9
超市类      超市C               5

...............


有30多个type,每个type下面有很多merch,每个merch下面有对应的频数 count

如果我想把每类type中,count 最大的前2个merch分别找出来,该怎么编程呢?请教各位高手!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-9-25 20:50:32
这个简单
data have;
input type $ merch $16. count@@;
cards;
百货类      百货商场A        10
百货类      百货商场B        9
百货类      百货商场C        5
超市类      超市A              10
超市类      超市B                9
超市类      超市C               5

;
proc sort data=have;
by type descending count;
run;
data want(drop=total);
set have;
by type descending count;
if first.type then total=0;
total+1;
if total<=2;
run;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-9-25 22:53:13
beijingdizheng 发表于 2013-9-25 20:50
这个简单
data have;
input type $ merch $16. count@@;
data want(drop=total);
set have;
by type descending count;
if first.type then total=0;
total+1;
if total<=2;
run;
想问一下,这个数据步,好像是先将type分类好了,然后再在分类里面进行total的计数。为什么会这样呢?
可以理解为用by分类了,然后下面的语句都是在分类里面进行的么??
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-9-25 23:06:07
可能还有一些特殊情况需要考虑,比如排名第一的merch有三个,应该就不要考虑排名第二的了把,或者第一有一个,但第二有两个以上。我记得以前有高手用sql写了一段简单的,但是找不到了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群