全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
2914 8
2010-01-06
悬赏 100 个论坛币 未解决
急盼高手相助解决

有这样一批数据,含有2个字符变量X,Y,一个数值变量n。格式如下
X    Y      n
a1   b1    2
a1   b2    0
a1   b3    5
.............
a1  b40   3
a2  b1     3
a2  b2     0
................
a2  b40   1
.................
.................
a60 b1    2
a60 b2    1
................
a60 b40  3

X代表a1-a60,Y代表b1-b40,X与Y一一对应,因此共有60*40=2400种组合,而n则代表每一种组合的数目,例如a1与b1的组合频数为2。

根据这样的数据,我们可以得到
(1)X与Y所有组合的频数,即对n求和N。
(2)X在每个取值时的频数,例如X=a1时的总个数(Y=b1,b2..........b40)
(3)Y在每个取值时的频数,例如Y=b1时的总个数(X=a1,a2..........a60)
(4)X与Y每种组合的数目,即原始n的数值



目标:
准换为含N (N为总频数)条记录,100个变量(a1,a2,a3......a60,b1,b2.......b40)的数据库。100个变量均为布尔逻辑(取值为0或1)。
新数据库为N行,100列。

要求:将原始信息(2)(3)(4)中各数值在新数据库中准确体现。注意:X与Y的组合信息。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-1-6 17:08:29
11.xls
大小:(164.5 KB)

 马上下载


原始数据如附件
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-1-6 23:07:10
2# edragon1983
复制代码
*I did not use the excel data;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-1-6 23:11:06
不知道是不是你要的


data old;
input v1$ v2$ n;
datalines;
a1   b1    2
a1   b2    0
a1   b3    5
a1  b40   3
a2  b1     3
a2  b2     0
a2  b40   1
a60 b1    2
a60 b2    1
a60 b40  3
;
run;

data new;
set old;
do i=1 to n;
output;
end;
run;

option missing=0;
data new1(drop=v1 v2 n i);
set new;
array a{60} a1-a60;
array b{40} b1-b40;
a{substr(v1,2)}=1;
b{substr(v2,2)}=1;
run;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-1-6 23:21:53
4# funnyxuke

oh. Yours is better-faster.

复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-1-6 23:37:29
4 minutes later than your post.


5# jingju11
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群