附件为我在pubmed下载的medline结果,为37篇英文文章(我们这里称作记录),文件中以"PMID-"隔开的为一个记录
我要生成一个SAS数据集,每个记录(即文章)为一个观测,其中的变量需要包含以下几个:PMID;TI;AB;MH。其它的可有可无。
这四个东西分别代表我文章的id, title, abstract 和 mesh terms,其中变量的值是短杠“-”后面的文字,当然,有些文字可能跨行。
另外,MH可能有多个,我需要将所有的MH合并成一个变量
如何有效地利用infile, input进行导入,望高手指点
非常感谢,些许论坛币,聊表寸心