急盼高手相助解决
有这样一批数据,含有2个字符变量X,Y,一个数值变量n。格式如下
X Y n
a1 b1 2
a1 b2 0
a1 b3 5
.............
a1 b40 3
a2 b1 3
a2 b2 0
................
a2 b40 1
.................
.................
a60 b1 2
a60 b2 1
................
a60 b40 3
X代表a1-a60,Y代表b1-b40,X与Y一一对应,因此共有60*40=2400种组合,而n则代表每一种组合的数目,例如a1与b1的组合频数为2。
根据这样的数据,我们可以得到
(1)X与Y所有组合的频数,即对n求和N。
(2)X在每个取值时的频数,例如X=a1时的总个数(Y=b1,b2..........b40)
(3)Y在每个取值时的频数,例如Y=b1时的总个数(X=a1,a2..........a60)
(4)X与Y每种组合的数目,即原始n的数值
目标:
准换为含N (N为总频数)条记录,100个变量(a1,a2,a3......a60,b1,b2.......b40)的数据库。
100个变量均为布尔逻辑(取值为0或1)。
新数据库为N行,100列。
要求:将原始信息(2)(3)(4)中各数值在新数据库中准确体现。注意:X与Y的组合信息。