想要请教一下如何从代码文件中提取涉及的数据集名和变量名？

viewerbio

5478

收藏 2012-09-09

悬赏 5 个论坛币未解决

不好意思，打扰一下大家，想要请教一个程序：）
自建逻辑库ia中有一百多个数据集；每个数据表中每行是一个观测样本，每列是一个指标；不同数据表的所含指标也不尽相同；
同时，实验室需要用这些数据来做一些分析任务，这些分析任务一般只会各自涉及到几个数据集，每个数据集也未必总是使用全部的指标；
最近想统计下这些分析任务中数据表和变量的使用情况，

不知怎么用sas写个程序，可以提取并导出如下形式的excel表格？
分析任务名称1 数据表名1 变量名1
分析任务名称1 数据表名1 变量名2
分析任务名称1 数据表名1 变量名3
分析任务名称1 数据表名3 变量名3
分析任务名称1 数据表名3 变量名5
分析任务名称2 数据表名2 变量名3
……

其中，1，每个项目都用sas来做，每个分析任务目都放在一个单独的文件夹下，文件夹下放了相应的sas代码文件（有时一个分析任务里面不止一个代码文件）；
2，代码中被引用的数据集名字，可根据set ia.??? 或者sql的select …… from ia.?? 来找出；
3, 被涉及的数据集中的指标，则可根据“keep ?? ?? ??”、“keep=(??,??,……)”、“select ??,??,??,……, from ia.??”来找出，自定义变量和重命名后的变量新名字就不去提取了
本人sas还处于初学阶段，还望大家不吝赐教：）

比如code1只涉及 data1（变量共100个，但此code只使用了var1 var2 var3）和data3（变量使用了var3 var5）
那么我就整理为
code1 data1 var1
code1 data1 var2
code1 data1 var3
code1 data3 var3
code1 data3 var5
然后再看code2，只涉及了data2（只用了变量var3）
于是我就在之前的输出结果中再补上一行
code2 data2 var3

夏应存时间序列分析讲义含R软件实例.rar

大小:2.53 MB

马上下载

送给大家学习一下，虽然不是sas

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

playmore

2012-9-10 09:10:33

我能想到的就是用正则匹配keep,select等字段
但是你的数据集和变量的数量很多
正则表达式又没法写
期待高手了！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

nomad5

2012-9-10 13:24:31

要数据集名和数据集中的变量名？

打开sashelp.vcolumn你就会了。

附件列表

未命名.JPG

原图尺寸 16.9 KB

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

viewerbio

2012-9-10 22:10:34

nomad5 发表于 2012-9-10 13:24
要数据集名和数据集中的变量名？

打开sashelp.vcolumn你就会了。

不过，有些分析任务中并未用到逻辑库下所有的数据集，有些数据集并未用到所有的变量……

所以，俺想对之前别人做过的那些分析任务的代码做下汇总，整理下每个任务中涉及到的数据集，以及数据集中被使用的变量（并非所有变量被使用）

比如code1只涉及 data1（变量共100个，但此code只使用了var1 var2 var3）和data3（变量使用了var3 var5）
那么我就整理为

code1 data1 var1
code1 data1 var2
code1 data1 var3
code1 data3 var3
code1 data3 var5

然后再看code2，只涉及了data2（只用了变量var3）
于是我就在之前的输出结果中再补上一行
code2 data2 var3

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

wlx31416

2013-7-12 00:53:55

谢谢楼主

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群