全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
2011-11-26 06:42:07
找个大的移动硬盘,作为虚拟内存,其容量必须超过实际被读入文件的体积。如果被读入文件太巨大,只能拆分成为比你移动硬盘容器小一些的文件。
如果用固态硬盘,那就完美了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-11-28 23:00:27
abelus 发表于 2009-6-27 15:12
对多个变量的处理,要用到SAS的marco了,如果变量命名比较规则,不会是太大的问题。

如果是记录条数多, ...
比如说我有2TB的数据需要排序,变量不是很多,但是观测多,应该怎么办?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-11-28 23:08:20
abelus 发表于 2009-6-27 15:14
说说数据处理的要求吧,具体要得到啥结果之类的,越详细越好。

我处理过千万条记录级别的数据,SAS完全可 ...
好厉害,
我想问的是,比如如何给2TB的数据排序,这个数据变量不是很多,但是观测很多,应该怎么办?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-11-28 23:16:48
kofsphere 发表于 2009-10-13 21:54
楼主你要是用了SAS/SQL 就不发这种问题了
能详细的解释一下这句话嘛? 谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-11-30 20:38:24
今天问了一个人,他说他曾经用sas出来过2tb的数据,出来起来出了慢点没有任何问题,其实也不算太慢,比如排个序半小时到一个小时
他电脑内存8G,硬盘比较大。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-12-2 17:13:44
进来学习学习!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-12-12 15:53:38
不懂啊
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-12-12 15:54:02
研究
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-12-20 10:53:27
比较难吧 补太好实现
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-1-4 08:51:58
macro
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-2-9 13:15:37
数据处理阶段如果是海量级别比如达到TB以上甚至PB级别,应该交给数据库来处理。利用数据库集群技术来处理:EMC公司IBM等都有基于mapreduce做出的面向数据仓库级别的数据库。sas可以专心利用处理好的数据来做模型的分析,关于模型处理方面是否可能可以和数据库那样分布式并行计算(对sas我是入门级人员)。海量处理在软件无法优化的情况下只能充分利用分布式技术增加内存和cpu和IO来加快处理速度。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-3-1 22:16:36
这个 不懂
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-3-2 14:56:34
围观,目前处理的变量也就一百多个,不算大批量了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-3-20 23:48:41
我在学校里只对excel上的数据处理过,还有就是直接上服务器索取的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-4-16 19:22:36
不错
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-4-16 19:32:50
好问题,希望尽快有人赐教,谢谢!大家共同进步。。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-5-1 11:34:55
太强悍了……
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-5-7 09:32:07
目前只能是oracle或者db2合用sas,才能处理
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-6-13 08:57:33
学习了,好贴
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-6-21 22:30:19
学习
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-6-27 05:44:39
xzyjy520 发表于 2009-6-21 01:53
a a a a a a a a a a a a a  a a
qiang da de ren
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-7-10 10:17:11
可以考虑考虑
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-7-11 21:52:44
你自己有那个权限使用ORACLE 吗,有的话不可能不知道,用SAS连接是很方便的吧
直接访问ORACLE 数据库:libname oralib oracle user=xxx pw=xxx path=dbmssrv scheme=educ;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-7-19 18:11:23
学习了。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-8-8 12:29:41
在sas中,第一条数据先读入pdv中,在进行data步;然后在读入第二条数据,进行data步。。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-8-19 10:18:05
好问题
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-8-20 11:48:20
邢不行 发表于 2011-11-28 23:08
好厉害,
我想问的是,比如如何给2TB的数据排序,这个数据变量不是很多,但是观测很多,应该怎么办?
应该用index吧,会快很多貌似。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-9-18 15:35:05
420948492 发表于 2009-6-30 16:22
通过看上面的贴好像自我感觉有误区,其实没有必要处理全部的数据,只要能得到近似正确的结果,还收要考虑效 ...
1000W个变量,而不是个案,如果是变量的话,就是要降维的;个案多了才要降维,才要优化解释。实际上如果仅是个案多,那么平常的算法也没多大问题吧。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-10-6 09:59:23
讨论出来结果了吗?有什么好方法?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-10-19 15:54:14
这个问题不适合小型机处理
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群