全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
3603 4
2013-08-17
手头有大量的csv表格,用insheet using *.csv导入stata时,第一列id因为是纯数字被识别为double,但是id由15位数字组成,insheet过后在stata中自动用了"10位数字+e15"的科学计数法表示,丢失了最后几位数字...
求教如何破~

自己有几条思路,但都不知道如何操作,仅供参考:
1、将double的默认格式设为%16.0g(目前为默认%10.0g,导入数据后再format %16.0g最后几位还是丢失了)
2、导入时以string存储id,因为表格有几万个,不可能一一修改csv(例如加个字母啥的),不知道有没有什么命令能实现
3、用命令行的stat transfer软件转换,但是表格中有很长的字符串,用stat transfer批量转换后不知道为什么每个string都最高限制为str80而非str244,这样又丢失了许多数据...但是用窗口模式的stat transfer转换就不会出现这个问题,难道是有什么选项?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-8-17 11:12:04
这种数量巨大的问题还是交给数据库解决靠谱
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-8-17 17:51:07
insheet using myfile.csv, clear double
format id %16.0f
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-8-18 18:50:35
受到警告
提示: 该帖被管理员或版主屏蔽
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-8-18 21:10:29
口说无凭,放个一个csv表格上来,作为附件,想帮你的人才知道问题究竟出在何处啊!











二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群