全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
1711 1
2012-02-15
悬赏 20 个论坛币 未解决
请问各位大侠,如何将下面原始信息读入SAS,用以生成包括5个变量的1条SAS数据?如果原始信息过于复杂,需要进行简单调整之后才能使用SAS读入,那么没有问题,请您尽管按需调整,之后进行编程。多谢各位大侠指导。

×××××××××××××××××××××××××××××××××××××××××××××××××

某某商贸有限责任公司

某某大街130号
凤凰城市, 亚利桑那州 (邮编 58128-1413)

联系人名称: 张富贵先生

产品介绍: 马铃薯是茄科茄属一年生草本。又称土豆、洋芋、山药蛋等。地下块茎呈圆、卵、椭圆等形,有芽眼,皮红、黄、白或紫色。地上茎呈棱形,有毛。奇数羽状复叶。聚伞花序顶生,花白、红或紫色。浆果球形,绿或紫褐色。种子肾形,黄色。多用块茎繁殖。性喜冷凉高燥,对土壤适应性较强,但以疏松肥沃的砂质土为佳。块茎可供食用,是重要的粮食、蔬菜兼用作物。有的学者认为马铃薯共有 7个栽培种,主要分布在南美洲的安第斯山脉及其附近沿海一带的温带和亚热带地区。最重要的马铃薯栽培种是四倍体种。四倍体栽培种马铃薯向世界各地传播,最初是于 1570年从南美的哥伦比亚将短日照类型引入欧洲的西班牙,经人工选择,成为长日照类型;后又传播到亚洲、北美、非洲南部和澳大利亚等地。

公司声明:本公司生产土豆,这种土豆质量优质,适宜与牛肉同时烹饪。如果你想购买,请到本地超市询问。量大,价格从优;量小免费品尝。价格大概10$。如果你是我们的老客户,价格还可以便宜10%。

下个公司:

×××××××××××××××××××××××××××××××××××××××××××××××××

5个变量的1条SAS数据的原始信息读取说明:

变量1:读取第1行。
变量2:读取第2-3行。
变量3:读取第4行中"联系人名称:"之后的内容。
变量4:读取"产品介绍:"与“公司声明:”之间的内容。
变量5:读取"公司声明:"与“下个公司:”之间的内容。

至此,我们完成第1条数据读入SAS。下面开始转入下条,准备开始第2条数据读入SAS。换句话说,每个公司生成1条SAS数据。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-2-15 10:01:51
First, u need to store u input words into a txt file, like 'E:\test\新建 文本文档.txt'.
Then, u can use the following code to read the txt file.

data test01(drop = fid text);
        format var1-var5 $32000.;
        retain var1-var5;
        infile "E:\test\新建 文本文档.txt" lrecl=32000 length=len;
        input text $varying32000. len;
        fid + 1;
        select (fid);
                when (1) var1 = text;
                when (2) var2 = text;
                when (3) var2 = compress(var2||text);
                when (4) var3 = substr(text, find(text,':')+1, length(text)-find(text,':'));
                when (5) var4 = substr(text, find(text,':')+1, length(text)-find(text,':'));
                when (6) do;var5 = substr(text, find(text,':')+2, length(text)-find(text,':')-1);fid = 0;output; end;
                otherwise;
        end;
run;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群