全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
7181 3
2011-03-21
现在有4000+个excel文件,这些文件在一个文件夹中,命名没有规则,命名是中文长语句
excel文件内部是完全一样的,也就是表头一样,变量名称一样等,但是观测数不一样
现在需要从4000多个文件中将观测值合并为一个数据集。


现在我的办法是用pipe获得所有文件名后,用import读入,
但是这样子存在两个致命的问题:
1.太慢,要运行好几个小时
2.变量的长度读入的时候不能统一

求该问题好的解决方案!!!


该问题尝试用SAS解决,但是效果不好、


找到一段VBA程序,合并表格速度要快很多。共享一下

在工具-宏-宏中



复制代码


介绍几个主要的参数:
"第一部分" 是要合并的很多表格的sheet名字
("sheet1").是合并之后的sheet名字
("B3:R7是需要合并的格子 区间
("A65536"). 是从该格子向上判断,非空
附件列表

第一部分.xls

大小:24.5 KB

 马上下载

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2011-3-21 21:15:51
先在网上找个批量合并excel的软件,把你那4千多excel合并了,然后用sas再导
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-3-21 23:00:05
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-3-22 22:32:26
http://blog.sina.com.cn/s/blog_6a90ae320100namg.html
上面这篇博文是讲如何导入一个文件夹中所有txt格式数据的方式,导入excel原来是一样的,对楼主也许会有帮助
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群