今天工作的时候遇到的个较为麻烦的问题。
解决的目的是从若干的数据里,筛选出重复的数据,并重复的数据删除,讲变量内容不一样的数据保留。
由于数据量会很多至少上几百条需要进行数据整理,需要提炼出内容不一样的数据进行保留。
请教各位高手有无方便快捷的方法对数据进行提取,小弟不才SAS刚上手,所以今天完全是通过手工方式去完成这样的工作。
--------------------------------------------------------------------------------------------------------------------------------------------------------------------
以下是我经历的案例:
我首先用
Proc SQL;
Create table a1 as
Select * from a
Group by name
Having Count(*)>1;
Quit;
进行重复数据的筛选,然后数据让我犯难了。出来的结果居然是这样的:
-------------------------------------------------------------------------------------------------------------------------------------------------------------------
Name City Sex 身份证号
张三 上海 男 888888
张三 北京 女 888888
张三 上海 男 888888
张三 上海 男 888888
-----------------------------------------------------------------------------------------------------------------------------------------------------------------
有无方法可以实现以下结果:
Name City Sex 身份证号
张三 上海 男 888888
张三 北京 女 888888
--------------------------------------------------------------------------------------------------------------------------------------------------------------------
只保留不一样的数据,如数据间是重复的将其刨除。
如大哥们,有应用方案请提示下,最好有程序编辑,谢谢!