全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
1732 1
2015-05-04
我有两组数据用的是不同的identifier,相同的只有company name,我想用的方法是通过sas的spedis(name1,name2)来鉴别是不是同一个公司,小于30的就认为是一样的公司名,大于的就再人工鉴别。问题是现在的两组数据observation数也不一样,怎么才能把他们merge到一起并保证所有的name1与所有的name2都能配上对呢?
[size=13.3333330154419px]如下:
[size=13.3333330154419px]    identifier1 name1        identifier2 name2
[size=13.3333330154419px]     1           zaa          A          MMM
[size=13.3333330154419px]     2           bllu         B          bjo
[size=13.3333330154419px]     3           wes                        

我想要的结果是
[size=13.3333330154419px]identifier1 name1 identifier2 name2 spedis_score_lt_30
1                     zaa                A          MMM           1
1                     zaa                B          bjo              0
2                     bllu                A          MMM           0
2                     bllu                B          bjo              0
3                    wes                 A          MMM           1
3                    wes                 B          bjo              0

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-5-4 16:47:58
proc sql ;
        create table c as select a.*,b.*,(case when spedis(name1,name2) lt 30 then 1 else 0 end) from a,b order by identifier1,identifier2;
quit;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群