全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
1642 2
2014-04-10
由于数据库过大,我在编程的时候经常遇到运行空间不足的问题,也就是运行过程中产生的过程数据库太多,严重占用了临时空间。比如我现在想把每个客户的最早交易时间取出来,涉及到5个数据库的链接问题,用data步来做,然后用sql来取最早的交易时间。我现在想把data步和sql 步合并到一个程序里,以减少临时空间的利用,该如何编程呢?具体程序示例如下:

data trans;
set a1 a2 a3 a4 a5;
run;

proc sql;
create table trans2 as
select id,min(trans_time) as firsttranstime;
from trans;
quite;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-4-10 11:11:58
0 keep id trans_time
1 5个分开做,再汇总做一次,空间不够,时间来换。
2 估算下id的量,在set 5个数据可行的前提下用hash来做
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-4-12 11:31:50
It is a big problem.

The bottom line is to minimize the steps. Try to simplify your problem.

The solution for your problem would be simplified as,

proc sql;
  
  select sex, min (age)
  from  (
           select  age, sex from sashelp.class
           outer union corr
           select  age, sex from sashelp.class)

group by 1;

quit;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群