不好意思,打扰一下大家,想要请教一个程序:)
自建逻辑库ia中有一百多个数据集;每个数据表中每行是一个观测样本,每列是一个指标;不同数据表的所含指标也不尽相同;
同时,实验室需要用这些数据来做一些分析任务,
这些分析任务一般只会各自涉及到几个数据集,每个数据集也未必总是使用全部的指标;
最近
想统计下这些分析任务中数据表和变量的使用情况,
不知怎么用sas写个程序,可以提取并导出如下形式的excel表格?
分析任务名称1 数据表名1 变量名1
分析任务名称1 数据表名1 变量名2
分析任务名称1 数据表名1 变量名3
分析任务名称1 数据表名3 变量名3
分析任务名称1 数据表名3 变量名5
分析任务名称2 数据表名2 变量名3
……
其中,1,每个项目都用sas来做,每个分析任务目都放在一个单独的文件夹下,文件夹下放了相应的sas代码文件(有时一个分析任务里面不止一个代码文件);
2,代码中被引用的数据集名字,可根据set ia.??? 或者sql的select …… from ia.?? 来找出;
3, 被涉及的数据集中的指标,则可根据“keep ?? ?? ??”、“keep=(??,??,……)”、“select ??,??,??,……, from ia.??”来找出,自定义变量和重命名后的变量新名字就不去提取了
本人sas还处于初学阶段,还望大家不吝赐教:)
比如code1只涉及 data1(变量共100个,但此code只使用了var1 var2 var3)和data3(变量使用了var3 var5)
那么我就整理为
code1 data1 var1
code1 data1 var2
code1 data1 var3
code1 data3 var3
code1 data3 var5
然后再看code2,只涉及了data2(只用了变量var3)
于是我就在之前的输出结果中再补上一行
code2 data2 var3