全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
2264 2
2016-01-31
csv中的数据转换为sas data-set中遇到一个奇怪现象
data wk;
infile "xxxx.csv" dsd delimeter = ',' missove encoding = 'iso-2022';
infomat a b $15.;
fomat a b $15.;
input a b;
run;

a b 是csv中的文字,但是因为是中国来的数据都经过乱码处理,看不清是什么。

然后假设csv中有100条数据,执行的以上程序。其中有一条a和b的文字都被并在了a中,a和b中间虽有逗号区分但似乎被忽视。然后考虑到可能encoding 选项出现了问题。把encoding = 'iso-2022'选项删除后,原来错位的一条数据对了,但是之前没有被错位33条数据出现了错位。。。


以上情况,能考虑到的问题有那些哪?请高手赐教。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-2-1 09:12:53
贴一些样本数据上来,才好帮忙
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-2-2 08:07:30
没有样本数据,只能瞎猜一下。
先试试这个:

data wk;
infile "xxxx.csv" dsd encoding ='iso-2022';
input a $ b $;
run;

要是不行还有这么一招: 把csv用Excel打开,然后转存为Excel格式,再用proc import将数据从Excel文件中导出。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群