全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
2199 4
2017-08-11
A表有一列关于地址的变量address,B表有一列关于小区的变量village。
现在我想创建一张表C,包含全部A表的内容,且满足:
如果A.address中包含B.village,则把B.village添加到A表后面,
如果A.address中不包含B.village,则添加为缺失。

我的代码如下:
proc sql;
create table c as
select a.*,d.village as village
from a
left join
(select a.address,b.village
from a,b
where find(address,compress(village))>=1) as d
on a.address=d.address;
quit;

结果:C表的观测数大于A表,猜测是因为A.address中某些观测同时包含B.village中多条观测引起的。
请问有什么方法可以解决?

附件列表
1.png

原图尺寸 7.24 KB

1.png

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-8-12 05:38:53
确实是由于一个Address里面包含了多个Village造成的条数变多。
如果不想改变原来A数据集条数,可以转置一下,把对应的多个Village做成多个变量。具体就看你需要怎么使用了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-8-12 16:46:48
lvmuqu 发表于 2017-8-12 05:38
确实是由于一个Address里面包含了多个Village造成的条数变多。
如果不想改变原来A数据集条数,可以转置一下 ...
可以说的再具体一点吗?我就是想要找到(A表address)中包含(B表village)的字符串的观测。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-8-14 10:54:14
yaoyinuo888 发表于 2017-8-12 16:46
可以说的再具体一点吗?我就是想要找到(A表address)中包含(B表village)的字符串的观测。
proc sql;
        create table c as
        select a.address,b.village
        from a,b
        where find(address,compress(village))
        ;
quit;
proc transpose data=c out=cc(drop=_name_) prefix=village;
        by address;
        var village;
quit;
proc sql undo_policy=none;
        create table want as
                select distinct a.*,cc.village1,cc.village2
                from a left join cc on a.address=cc.address
        ;
quit;
这样最后出来的条数就不会变了,具体哪些观测含有village你需要再筛选下
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-8-15 09:03:46
lvmuqu 发表于 2017-8-14 10:54
proc sql;
        create table c as
        select a.address,b.village
明白了,谢谢你的帮助
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群