全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
3714 5
2015-08-13
数据集A和数据集B共有变量为姓名,性别,年龄,出生地,需要将两个数据集匹配起来。

需要解决的问题:两数据集的姓名,如果3个字中有两个字相同,就认为是可能是同一个人。
                          proc sql?
                          程序如何实现?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-8-16 22:30:42
你的数据是中文的还是英文的?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-17 08:43:29
happyzihao 发表于 2015-8-16 22:30
你的数据是中文的还是英文的?
中文的,但是考虑到读音的问题,也提取了拼音
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-17 14:00:20
qcasrl 发表于 2015-8-17 08:43
中文的,但是考虑到读音的问题,也提取了拼音
姓名为什么可以两个字相同就当做同一个人了呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-17 14:01:51

proc sql noprint;
create table x as
select *
from x1 as a left join x2 as b
on a. firstname = b. firstname
and a.lastname = b.lastname;
quit;

思路大概是这样的,但是觉得你用的match变量怪怪的。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-17 14:52:51
例如
A表中有名字:李建国
B表中有名字:马建国
就匹配


A表中有名字:李香兰
B表中有名字:李晓兰
呢?

建议把情况描述周全喔
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群