全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
8275 7
2013-12-29
我的数据是这样的,总共有6列,理论上前两列分别是ID号,后四列是数值型变量,但是在抓数据的时候出现了串行的形式,问题主要出现在后四列上,比如有的是空格,有的出现了字符型变量,具体的我给个sample
7323017   2115412345      700             1073            473     2031
5953681   2090387456      313                                 58       373
7051759   1826336475      917             299             256     1151
8002567   3043612354      102             1998            65      684
377031     3121967678      621             1655            172     1072
10092211        1084445783      380             548             好吃     524


比如说第二行第四列出现了空格,最后一行第五列出现了这样的字符。另外我知道前两列ID的最大长度都不超过10,后四列的数值长度都不超过8.对于像最后一行这样的样本,我的分析是没有的,所以我需要把他踢掉,所以读入数据时我的想法很简单,就按照现在的设定读,像最后一行这样的肯定到了第五列就读不进去,变成空值,到时候我直接删除就ok。我的code如下:

复制代码
我觉得没啥问题,可是出来的结果居然是这样的

QQ截图20131229171138.png

前两列没问题,我就没粘,为什么1073跑到了第五列?他应该是在700的后面啊?然后下面的似乎都往后串了。求高人解答!!!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-12-29 17:34:45
自己顶,求各位大神帮我看看是哪里错了?或者说这种问题应该怎么解决?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-12-29 18:22:44
把数据贴上。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-12-29 18:32:49
Rock2000 发表于 2013-12-29 18:22
把数据贴上。
已经贴了啊,sample下面的就是数据的一部分
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-12-30 09:58:38
最死板的方法:在文本数据中导入前用替换,把两个空格替换成一个空格就行了。
直接导入不要用DSD,DSD会把连续的两个分隔中插入一个字段。

复制代码


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-12-30 20:15:47
scarfacetony 发表于 2013-12-30 09:58
最死板的方法:在文本数据中导入前用替换,把两个空格替换成一个空格就行了。
直接导入不要用DSD,DSD会把 ...
多谢!确实应该把dsd去掉,解决了我的问题,另外,大神,可否再请教一个用SAS处理大数据的问题?我有很多纯数据文件,见下面的截图 QQ截图20131230201048.png
类型那里只有“文件”二字,每个文件有500M,我想把它读进SAS,但是当我指定类型为txt时,SAS提示我该文件不存在。于是我想把这个文件转存成txt格式的,问题就来了,我的电脑是4G内存,用记事本打开一个文件差不多花10几分钟,虽然打开了,当我选择另存为txt时,居然提示我存储空间不足,无法执行该命令,我确定我的硬盘有足够空间的。请问你知道该问题该如何解决吗?或者怎么直接用SAS读取这类文件?多谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群