全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
2379 5
2010-10-26
悬赏 100 个论坛币 已解决
由于我之前发的帖子被沉下去了,再次发帖求助。

附件有数据,现在的问题是有部分内容的中间加入了回车符,使一条记录在2行显示,用外部读入法读入的时候就被当成2条记录读入了。
现在希望能解决这个问题,经过大家的帮助,我现在有2条思路。第一条是用input方式读入,可以解决回车的问题,有人帮写了代码如下:
data test;
   infile 'E:\样本.txt' lrecl=300 dlm='“,' dsd firstobs=2;
    input
                city :$6.
                quxian :$18.
                yingyeting : $42.
                staff_id : $10.
                staff_name : $33.
                SERIAL_NUMBER  
                RECOMM_DATE : $19.
                yewu : $18.
                qudao :$10.
                jieshou_flag :$6.
    ;
run;
这里有一个问题是,yingyeting这个变量中有逗号,这样有部分记录就会被拆散,后来我用逗号做分隔符,加入dsd选项,但第二行的引号却又被当做一个变量读入了。有点左右为难,哪位高手能在这方面给继续解决一下,不胜感激。

第二条思路是用函数compbl和compress组合将回车符拿掉,只可惜我才疏学浅,在读入阶段怎么用搞不清楚,哪位高手能用这个方法解决一下,小弟谢过了!

样本.txt

大小:926 Bytes

 马上下载

最佳答案

jiagangw 查看完整内容

1# 040108020007 filename dt 'D:\temp'; data tem; infile dt(Sample.txt) lrecl=400 truncover; input line $400.; file dt(S2.txt); if _n_ ne 1 then do; if length(compress(line,'"','K')) < 20 then do; input line2 $400.; line = trim(line)||' '||left(line2); end; end; output; put line; run; proc import datafile='D:\temp\S2.txt' out=dstn ...
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-10-26 16:26:36
1# 040108020007

filename dt 'D:\temp';
data tem;
   infile dt(Sample.txt) lrecl=400 truncover;
   input line $400.;
   file dt(S2.txt);
   if _n_ ne 1 then do;
      if length(compress(line,'"','K')) < 20 then do;
      input line2 $400.;
         line = trim(line)||' '||left(line2);
         end;
   end;
   output;
   put line;
run;
proc import datafile='D:\temp\S2.txt' out=dstnm dbms=csv replace;
run;   

以上程序仅针对所提供的文本文件,若更多的行对应一个观测可相应地修改程序


P1.txt
大小:(412 Bytes)

 马上下载

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-10-26 17:41:20
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-10-27 17:28:25
2# jiagangw

jiagangw 前辈的代码真是精彩! 此致敬礼!

一直在想怎样通过一个DATA步实现,通过学习前辈代码,现在终于实现了:

data test;
   infile "c:\files\test.txt" lrecl=400 dsd dlm="," truncover firstobs=2;
   length temp $400;
   input @ ;
   temp=_infile_;
   do while (length(compress(temp,'"','K')) < 20);
      input;
   input @;
        temp= cats(temp,_infile_);
   end;
   _infile_=temp;
   keep city--jieshou_flag;
    input @1
                city :$6.
                quxian :$18.
                yingyeting : $42.
                staff_id : $10.
                staff_name : $33.
                SERIAL_NUMBER  
                RECOMM_DATE : $19.
                yewu : $18.
                qudao :$10.
                jieshou_flag :$6.
    ;
run;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-10-27 19:09:56
这个莫非就是传说中的汪嘉冈老师?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-10-27 19:54:13
这么厉害!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群