全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
3442 5
2011-04-30
请问各位,如果data set中有duplicate observations(如SALARY data set),用MERGE合并EMPLOYEE 和SALARY的时候程序是怎么样处理的呢?谢谢啦~
data set:EMPLOYEE     SALARY
                name age         name salary
                Bruce 30          Bruce 40000
                Dan 35             Bruce 35000
                                         Dan 37000     
                                         Dan .


data work.empsalary;
merge work.employee (in = inemp)
           work.salary(in = insal);
by name;
if inemp and insal;
run;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2011-5-1 16:37:56
最后的结果是这样的:
                 Obs    name     age    salary

                                     1     Bruce     30     40000
                                     2     Bruce     30     35000
                                     3     Dan       35     37000
                                     4     Dan       35         .

我以前有看过对Merge和Set两个Statement在SAS里合并数据集的分析,对应不同的情况有不同的结果。就你举的这个情况,对姓名和年龄会重复写入新的数据集,最终的样本数目以Salary中的Duplicate数据情况为准。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-5-1 16:38:24
最后的结果是这样的:
                 Obs    name     age    salary

                                     1     Bruce     30     40000
                                     2     Bruce     30     35000
                                     3     Dan       35     37000
                                     4     Dan       35         .

我以前有看过对Merge和Set两个Statement在SAS里合并数据集的分析,对应不同的情况有不同的结果。就你举的这个情况,对姓名和年龄会重复写入新的数据集,最终的样本数目以Salary中的Duplicate数据情况为准。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-5-1 16:38:41
最后的结果是这样的:
                 Obs    name     age    salary

                                     1     Bruce     30     40000
                                     2     Bruce     30     35000
                                     3     Dan       35     37000
                                     4     Dan       35         .

我以前有看过对Merge和Set两个Statement在SAS里合并数据集的分析,对应不同的情况有不同的结果。就你举的这个情况,对姓名和年龄会重复写入新的数据集,最终的样本数目以Salary中的Duplicate数据情况为准。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-5-2 21:54:43
merge太灵活了,会出现各种预料不到的问题
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-11-12 21:31:20
如果是set的话是没有观测的,因为set不会合并数据,相同name的观测是列出,所以同一条记录不会从两个数据集中同时读取
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群