全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
2142 1
2015-12-20
是这样的, abc 三个分类变量, d是连续变量.

以上是背景

想要得到一个数据集, 数据集 有以下几列: abc sum(d) pct freq pctfreq
前两列ab是ab所有不同取值的组合, c是ab不同组合下分别对应的值, abc一组组合是唯一的, sum(d)是按照abc组合的和, pct是sum...................说不清楚了, 还是举例吧.
源数据:
rowabcd

1

1

1

1

20

2

1

1

1

30

3

1

1

1

40

4

1

1

2

11

5

1

1

2

12

6

1

2

1

13

7

1

2

2

22



汇总数据:
abcsum(d)pctfreq pctfreq

1

1

1

90

90/113

3

3/5

1

1

2

23

23/113

2

2/5

1

2

1

13

13/13

1

1/1

1

2

2

22

22/22

1

1/1
每一行的abc组合是唯一的, 就是pct的值, 计算的是相同ab取值下, 不同c取值对应的pct的值, 后面的pctfreq也是一个意思.
不太想用sql, 有没有一个procedure能够实现?
谢谢看帖的各位!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-12-21 10:43:12
1个proc步不好实现,2个proc freq吧
1个加weight d, 1个不加
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群