全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
1896 10
2013-11-27
我的数据是这样的:

第一列是星座,第二列是id号,剩下的第三列往后是该id的标签,具体如下:

天平座  120112010  旅游  天平座 逛街 美食达人
水瓶座  120113044  汽车  美妆 教育
金牛座  120234343  装修  读书  中欧商学院  金牛座  R语言  统计之都

每个人的标签数是不一样的,我希望变成下面的形式

天平座  120112010 旅游
天平座  120112010 天平座
天平座  120112010逛街
天平座  120112010 美食达人
水瓶座  120113044 汽车
水瓶座  120113044 美妆
水瓶座  120113044 教育
金牛座  120234343 装修
金牛座  120234343 读书
金牛座  120234343 中欧商学院
金牛座  120234343 金牛座
金牛座  120234343 R语言
金牛座  120234343 统计之都

大神们来拯救小菜鸟吧!最近又开始捣鼓数据,所以问题比较多。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-11-28 00:06:08
SAS吗?每行观测的变量数量都不一样你是怎么读进去的..=.=
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-11-28 00:22:49
wangxiuyu1993 发表于 2013-11-28 00:06
SAS吗?每行观测的变量数量都不一样你是怎么读进去的..=.=
是SAS,这个很简单,用infile+informat命令,没有的,他就会默认为空~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-11-28 00:23:39
自己再顶一下,期望明早起来的时候能看到大神们的回复!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-11-28 00:32:13
好吧- -我用SAS解决不了的问题一般都用MATLAB或者C++解决,因为SAS我才学不到一个月...这个我觉得如果数据量比较大的话可以用C++
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-11-28 03:04:04
假设你已经读入到SAS dataset “test” 里了。第一个变量叫constellation,第二个变量叫id,之后的标签叫label 。假设最多有label1-label10。
proc sort data = test; by constellation id; run;

data result;
    set test; by constellation id;
    array tmp{*} $ label1-lable10;
    length label $20.;
    do i = 1 to dim(tmp);
        if tmp[i] ne '' then do;
            label = tmp[i];
            output;
        end;
    end;
    keep constellation id label;
run;
   
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群