假如我的数据如下:
ID Income Education Sex
1 21 High Male
2 30 Low Female
3 35 High Male
4 14 Low Male
5 20 High Male
...
如果基于两个变量(Education, Sex)把我的观测值(Income)进行分类,那么定义一个新的变量Group,比方说吧,结果可能这样:对应High Male,Group =1;对应High Female,Group =2;对应Low Male,Group =3;对应Low Female,Group =4。那么数据即为:
ID Income Education Sex Group
1 21 High Male 1
2 30 Low Female 4
3 35 High Male 1
4 14 Low Male 3
5 20 High Male 1
如果仅仅基于两个变量(Education, Sex)把我的观测值(Income)进行分类,IF-THEN可以达到这个目的。难点在于我有8个组合变量(Education, Sex, Color, ...等等),所以观测值的组合种类很多。请教高手DATA或者PROC SQL中可有现成功能,用以实现以上目的:即定义一个新的变量Group用以标识我的观测值(Income)。如果没有,如何编程。谢谢。