全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
1583 3
2013-07-09
SAS版本是9.13,需要导入的数据是.tsv(450万条),而且变量也比较多,尝试多种导入的语句都失败,快要崩溃了,希望有高手帮忙提供下比较好的导入coding,谢谢!!如用

PROC IMPORT OUT= data.loan_mapp

            DATAFILE= "aa.tsv"

            DBMS=TAB REPLACE;

     GETNAMES=YES;

     DATAROW=2;

RUN;

成功导入后,发现变量的值会有空格,如“E 0 0 2 _ 1 0 0 3 0 2 9 8 3 0”,希望能高手帮忙出手解答,谢谢!

以下提供几条原数据。

STAT_DT CUST_NUM CUST_NAME OPEN_CUST_ORG_NUM BELONG_ORG_NUM PER_BELONG_ORG_NUM PER_COOPER_ORG_NUM PER_BELONG_PROTION PER_COOPER_PROTION BELONG_ZONE_CD CERT_TYPE_CD CERT_NUM CERT_ISSUE_ORG_NUM CERT_ISSUE_DT CERT_MATURE_DT CUST_MGER_NUM CUST_MGER_NAME CUST_STAT_CD CUST_TYPE_CD INDUSTRY_TYPE_CD CAREER_CD HIG_EDU_DEGREE_CD MARRIAGE_SITU_CD CRBC_EMPLY_IND OVERS_CUST_IND VIP_IND CUST_ACTIV_IND FUND_CUST_IND FUND_MAR_CUST_IND CRBC_CHREM_CUST_IND INSURE_CUST_IND TRDPTY_KEEP_CUST_IND ALL_IN_ONE_ACCT_IND OWN_CRDT_CARD_IND SALARY_PAYOFF_IND OPEN_CUST_DT CLOSE_DT LMT_TYP_CD CRDT_LMT AVAL_LMT LMT_INIT_DT LMT_MATURE_DT RISK_PREFER BIRTH_DT GENDER_CD INDV_YR_INCOME FAMILY_YR_INCOME MOBILE_NUM FIX_TEL ADDRESS EMAIL LOC_CORP CORP_TEL CORP_ADDR
20130331 E002_1003029830 TVB 000000000 756033     000000 1001 888888888888888888   2049/12/31   01 310 00000  00 00 N 0     0   1  0 2005/8/11        19861215 1   13800138000 13800138000 香港TVB大厦 888888@139.com  TVB 13800138000 TVB


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-7-22 23:21:59
是csv吧,是定长文本?分隔符是什么?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-7-23 17:17:17
用EG导入吧。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-7-23 17:19:10
话说,我们之前导入,是用DATA步的,是成功的,定义一下LENGTH\INPUT\IMFORMAT\FORMAT。没有用PROC IMPORT。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群