
请教各位大牛!
我现在有一个csv文件,里面有如下变量:
id:32位的字符串
txt:文本(这个是主要问题,长度无法确定,有的长有的短)
county:这列的记录全都是CN
day:20130412
time:10:20:54(24小时制)
data test.word;
infile 'F:\word.csv' dsd;
input id $ 1-32 txt $ @34 @'C' country $ province $ city $ day yymmdd8. time time8.;
format day yymmdd8. time time8.;
run;
关键是对txt的处理,我的想法,在读txt之前先把指针移到第34位,由于无法确定最大长度,所以不能直接指明第几列到第几列,但是下一列的country永远是CN开头,所以一个想法是让txt一直读到遇见“C",不知道我的code写的是否对???
事实证明好像错了,因为run之后数据集明显不对。。。求助各位大牛哪里错了,或者这样的数据集应该如何读?
数据截图在最上面!