全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
3836 9
2012-02-15
求教一个关于选择benchmark的问题;如下,我有两列数据,ID,和SPEND1001203  2.3
1001203  3.2
1003506  1.2
1006301   2.3
1006301   3.1
.........

然后我用proc means计算了每个id的spend的和。结果是:
1001203  5.5
1003506  1.2
1006301  5.4
.........

我想知道这个sum(spend)里面30%,30%,40%的这个值是出于什么sum(spend)?
就是说,median是50%的ID出于的一个位置,那么最大的30%的值出于什么位置?其中的30%处于什么位置?这样我才能分出3个group。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-2-15 17:04:45
推妈妈 发表于 2012-2-15 16:40
这个我也算不出来啊
等高手!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-2-15 17:05:03
楼主,你要不试试proc univariate ,里面有一个分位数表格,也许能解决你的问题。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-2-15 22:11:41
画个直方图
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-2-16 09:07:16
sl122113 发表于 2012-2-15 22:11
画个直方图
然后手动选择咩??
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-2-16 09:56:54
carol1222 发表于 2012-2-16 09:07
然后手动选择咩??
通过频数表可以知道30%所在区间,我觉得你就可以按照区间的上限或下限进行分组了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群