全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
1833 2
2018-07-19
悬赏 5 个论坛币 未解决
原始数据为前三列,需要计算的三个变量为后三列,怎么用sas实现?sas有没有现成的语句?sql效率似乎有点低。(数据量大概2000万,原始变量十几个,需要计算50多个变量,怎么样效率高?)
类别

年份

人数

相应类别的人数

相应年份的人数

相应年份与类别的人数

A

2018

5

23

11

11

B

2016

8

12

19

10

A

2015

4

23

13

8

C

2014

3

6

3

3

B

2015

2

12

13

2

D

2013

8

17

8

8

D

2016

9

17

19

9

A

2015

4

23

13

8

A

2018

6

23

11

11

C

2015

3

6

13

3

A

2011

4

23

4

4

B

2016

2

12

19

10



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-7-23 01:52:24
proc summary data=my_data;
CLASS 类别;
VAR 人数;
output out= data_want sum=;
run;

年份 just change CLASS to 年份;

proc summary data=my_data nway;
CLASS 类别 年份;
VAR 人数;
output out= data_want sum=;
run;

if you want to use BY instead of CLASS, table need to be sorted first.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-8-2 23:36:12
proc freq data = data;
tables 类别;
tables 年份;
tables 类别*年份;
run;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群