全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
1003 11
2015-01-19
悬赏 200 个论坛币 已解决
200 金币重金悬赏,现在有两个Excel  Workbooks 一个叫data one 另一个叫data two 怎么样才能用SAS 自动检查两个workbook 里的不同之处呢?

Data One.xlsx
大小:(9.92 KB)

 马上下载



Data Two.xlsx
大小:(10.89 KB)

 马上下载




我定义了三个tabs, data one 里有三个是april, march, june. data two 里有三个对应的是 good, better, best. 其中good 理应和march 对比,better 理应和april 对比,best 理应和june 对比。理想的结果是这些经过对比的tabs 里面的数据应该完全一致,不论里面有什么,顺序,数字,名字,还是table 开始的位置,比如附件里的tabs 有些是从 D列开始的,但有些从C 列开始。  但是两个workbooks 里的顺序乱了,不是一下就看出来的。 我用红色的标记出不同的数据。为了方便和SAS产生的结果对比。 

如果一个一个对比,假如我给你10 个workbooks, 每个workbook 都有30个以上tabs 全部打乱顺序,并且不告诉你其中哪些应该和哪些对位,应该怎么解决呢?

data one 和 data two 只是个例子,但我想要的是一个对比过程,即使数据更大更复杂也可以用类似的过程进行对比。 可以用SAS自动对比所有的不同名字的tabs吗? 

这个名字不同可以大体检查一下哪几个tabs应该对应。但是每个tab 就是一个table, 要确保一个workbook里的每个table里的数据都和另一个workbook里的所对应的每个table里的数据都一样。这用excel里的match和横竖lookup得查找半天。 

能用SAS自动得出哪些tabs 里的哪些数据不同吗? 先把例子中的问题解决,我后来提出的那个普遍且更难的问题,可以慢慢解决,但要保证正确。 

200金币仅表谢意,不够可以加,这个问题比较复杂的。 如果能全部尽可能自动的在SAS里对比,会获得更多的奖励。 

金币不是问题。可以到留学10区领取更多。 

最佳答案

yongyitian 查看完整内容

/* 用 proc Compare, 最简单的用法如下。其他用法在这里 */ http://support.sas.com/documentation/cdl/en/proc/61895/HTML/default/viewer.htm#a000057814.htm * June - Best, April-better, March-Good; proc compare data=june compare=best; run; proc compare data=April compare=Better; run; proc compare data=March compare=Good; run;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-1-19 07:48:24
/* 用 proc Compare, 最简单的用法如下。其他用法在这里 */
http://support.sas.com/documentation/cdl/en/proc/61895/HTML/default/viewer.htm#a000057814.htm


* June - Best, April-better, March-Good;
proc compare data=june compare=best;
run;

proc compare data=April compare=Better;
run;

proc compare data=March compare=Good;
run;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-1-19 08:23:41
不懂SAS,楼主核对下附件,应该是:good和March、better和April、Best和June一一对应吧。
不懂意思,是不是在sub1-sub12以及var1-var6排序相同的情况下,比较两个sheets的不同之处?
还是在sub1-sub12以及var-var6排序都不同的情况下,比较两个sheets的不同之处?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-1-19 09:25:54
heric221 发表于 2015-1-19 08:23
不懂SAS,楼主核对下附件,应该是:good和March、better和April、Best和June一一对应吧。
不懂意思,是不是 ...
不好意思把字打错了,只是个例子。 那些名字没有意义的,我想要解决问题的方法。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-1-19 09:31:34
heric221 发表于 2015-1-19 08:23
不懂SAS,楼主核对下附件,应该是:good和March、better和April、Best和June一一对应吧。
不懂意思,是不是 ...
我的意思是让任何一个workbook 和另一个workbook里面应当对应的tab 也就是table 里的所有数据都一样。 比如说你大体扫描了一下两个tab 知道,good 和 march 应该对应但是不确定两个table 中的数据是否完全一致。万一有不同应该怎么找?

不能用match 找,那样太慢了,一个tab 一个tab 的查会很耗时间。 所以我想SAS 应该可以把这个查验过程自动化,等高手解答。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-1-19 10:08:45
yongyitian 发表于 2015-1-19 09:56
/* 用 proc Compare, 最简单的用法如下。其他用法在这里 */
http://support.sas.com/documentation/cdl/en ...
谢谢拉,但是你看我的数据了吗? 每个table 第一列或前两或三列都是没有变量名字的其中的数据也是分及的例如0-5,6-10,11-15, 之类的,SAS 需要给个变量名字才能对比不规则的列吧?

我不能修改数据中的任何东西,如果有不同,只要记录下来就可以,因为这东西不是我弄的,只负责检查。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群