全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
1265 2
2014-01-10
悬赏 100 个论坛币 已解决
我想要将两个数据集合并,而且合并后a数据集里的所有观测值都要保留, 而b数据集里的观测值只保留与a数据集id相同的,不相同的排除。

a数据集有27320503个观测值,b数据集有972392个观测值,
照理说合并后的数据集c的观测值应该是27320503个,
可是程序运行后c的观测值竟然是27452634个。
我想问下问题出在什么地方?
(我自己做了两个简单的数据集做过测试,最后都能得到我想要的结果)


编写程序如下:

data c;
merge a(in=ina) b;
by id;
if ina;
run;


最佳答案

牵你↗左手 查看完整内容

数据是1对1么?也就是你a中的id和b中的id都是唯一的么,如果是1对多或者多对多就会造成c中的观测多于a中的观测
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-1-10 12:37:03
数据是1对1么?也就是你a中的id和b中的id都是唯一的么,如果是1对多或者多对多就会造成c中的观测多于a中的观测
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-1-13 21:25:34
谢谢,果然是有重复的ID
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群