全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
3006 3
2009-06-24
1、我记得有一个函数是计算2个字符串相似度的,可是我找不到了。大家谁能告诉我一下阿。。

2、还有一个比较棘手的问题,就是进行字符的模糊比较。

有2个包含身份证号的数据集,一个是数据集中的身份证隐藏了生日的月日。另外一个完整身份证。

我现在想判断除隐藏部门外,剩余部门一致的身份证号。

e.g.    A                                            B
        1234561981XXXX0015        123456198112120015                 /*完整身份证没有计算校验位,仅示例*/

我要挑出上述结果,隐藏部分的多种可能忽略。

我该怎么用通配符进行比较呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2009-6-24 17:16:30
看了一下,不知道是不是完全明白你的意思了,我觉得proc compare应该可以实现你要的想法。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-6-24 17:44:10
data workdata1 workdata2;
input A $18. B $19. @;
Anew=substr(A,1,10) || substr(A,15,18);
Bnew=substr(B,1,10) || substr(B,15,18);
if Anew=Bnew then output workdata1;
else output workdata2;
datalines;
1234561981XXXX0055 123456198112120055
;

run;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-6-24 21:30:36
realgod5417 发表于 2009-6-24 17:44
data workdata1 workdata2;
input A $18. B $19. @;
Anew=substr(A,1,10) || substr(A,15,18);
Bnew=substr(B,1,10) || substr(B,15,18);
if Anew=Bnew then output workdata1;
else output workdata2;
datalines;
1234561981XXXX0055 123456198112120055
;

run;
谢谢,~~~~~~~~~~~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群