全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
4225 11
2013-05-07
飞信截图20130507142556.jpg 请教各位大牛!

我现在有一个csv文件,里面有如下变量:
id:32位的字符串
txt:文本(这个是主要问题,长度无法确定,有的长有的短)
county:这列的记录全都是CN
day:20130412
time:10:20:54(24小时制)

data test.word;
infile 'F:\word.csv' dsd;
input id $ 1-32 txt $ @34 @'C' country $ province $ city $ day yymmdd8. time time8.;
format day yymmdd8. time time8.;
run;


关键是对txt的处理,我的想法,在读txt之前先把指针移到第34位,由于无法确定最大长度,所以不能直接指明第几列到第几列,但是下一列的country永远是CN开头,所以一个想法是让txt一直读到遇见“C",不知道我的code写的是否对???
事实证明好像错了,因为run之后数据集明显不对。。。求助各位大牛哪里错了,或者这样的数据集应该如何读?

数据截图在最上面!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-5-7 11:31:30
你看看csv文件的分隔符是什么,infile 'f:\word.csv' dsd dlm='09'x;很有可能是制表符,也就是tab键,在sas中就是'09'x
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-5-7 11:36:19
yykun 发表于 2013-5-7 11:31
你看看csv文件的分隔符是什么,infile 'f:\word.csv' dsd dlm='09'x;很有可能是制表符,也就是tab键,在sas ...
好像不是这个问题。。。。我按照你的run了一遍还是没解决问题
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-5-7 12:17:01
appleqiuqiu 发表于 2013-5-7 11:36
好像不是这个问题。。。。我按照你的run了一遍还是没解决问题
不懂了,能贴出来几条数据看看吗
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-5-7 14:33:11
yykun 发表于 2013-5-7 12:17
不懂了,能贴出来几条数据看看吗
图片如下,其中id、country、province、city、day和time都是很规则的,唯一不规则的就是txt列,由于我有几十万条这样的数据,所以根本无法实现确定txt列的最大长度,如果直接读的话肯定会把长度较长的截断,现在有什么办法可以完整的把数据读进来?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-5-7 14:33:46
数据举例
附件列表
飞信截图20130507142556.jpg

原图尺寸 20.57 KB

飞信截图20130507142556.jpg

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群