现有两个数据集a和b
数据集a:
index code year x1 x2 x3
102003 10 2003 1 2 3
102003 10 2003 2 2 3
102004 10 2004 1 4 5
102005 10 2005 2 4 5
102006 10 2006 1 6 7
102006 10 2006 2 7 8
122003 12 2003 1 8 9
122004 12 2004 2 9 10
122005 12 2005 1 10 11
122005 12 2005 2 10 11
122006 12 2006 1 11 12
142004 14 2004 1 12 13
142005 14 2005 2 13 14
162005 16 2005 1 14 15
162006 16 2006 2 15 16
数据集b:
index code year y1 y2 y3
102003 10 2003 1 2 3
102004 10 2004 2 3 4
102005 10 2005 3 4 5
102006 10 2006 4 5 6
122003 12 2003 5 6 7
122004 12 2004 6 7 8
122005 12 2005 7 8 9
122006 12 2006 8 9 10
152004 15 2004 1 2 3
162004 16 2004 2 3 4
172005 17 2005 3 4 5
现欲生成两个数据集c和d
(1)c:即 将首先对a数据集进行处理,对相同的code值,如果x1的值有1,有2,则取x1=1的那条值,把x1=2的那条删去,x1只有1值或只有2值的保留,然后与数据集b进行合并,得如下数据集:
index code year x1 x2 x3 y1 y2 y3
102003 10 2003 1 2 3 1 2 3
102004 10 2004 1 4 5 2 3 4
102005 10 2005 2 5 6 3 4 5
102006 10 2006 1 6 7 4 5 6
122003 12 2003 1 8 9 5 6 7
122004 12 2004 2 9 10 6 7 8
122005 12 2005 1 10 11 7 8 9
122006 12 2006 1 11 12 8 9 10
142004 14 2004 1 12 13
142005 14 2005 2 13 14
152004 15 2004 1 2 3
162004 16 2004 2 3 4
162005 16 2005 1 14 15
162006 16 2006 2 15 16
172005 17 2005 3 4 5
(2)生成数据集d :即提取数据集c中,对code值,在2003-2006年均有的,剔除某一年没有值的比如code为14,15不全的数据;
index code year x1 x2 x3 y1 y2 y3
102003 10 2003 1 2 3 1 2 3
102004 10 2004 1 4 5 2 3 4
102005 10 2005 2 5 6 3 4 5
102006 10 2006 1 6 7 4 5 6
122003 12 2003 1 8 9 5 6 7
122004 12 2004 2 9 10 6 7 8
122005 12 2005 1 10 11 7 8 9
122006 12 2006 1 11 12 8 9 10
多谢多谢~~~