全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
1521 6
2013-02-01
数据集a见下表:

x

  

a1

  
  

a2

  
  

a3

  
数据集b见下表:

y

  

b1

  
  

b2

  
  

b3

  
欲对a和b进行横向拼接,代码如下:
data c;
    if _n_=1 then do j=1 to 3;
        set a;
    end;

    set b;
run;
data d;
    if _n_=1 then do;
        set a;
        set a;
        set a;

    end;
    set b;
run;
运行之后发现数据集c和d不一样,上述两段红色代码应该是有区别的,但不知道区别在哪里,请高手解释以下,不胜感激。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-2-1 14:50:51
怎么说呢。。。
上面那个set a 三次的a 是同一个a, 所以读取了第三条记录。
下面那个三次set a的a 是“不同”的a,所以相当于读取第一条记录,然后被覆盖,然后再被覆盖。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-2-1 17:19:27
data e;
        merge a b;
run;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-2-1 17:20:44
你这个要解释清楚,需要从pdv的角度来讲,就可能说得比较清楚,可是我想了一会也没想清楚
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-2-1 19:01:51
SET语句的执行规则是这样的:

1. 一个DATA步中,每一个SET语句都独立地从其所指定数据集中读取数据。
2. DATA步执行过程中,每执行到某个SET语句,就从其所指定的数据集中读取下一条记录。
3. 任意一个SET语句没有数据可读的时候,整个DATA步结束。

楼主给出的例子
data c:
1. _n_=1时执行do循环,执行三次SET a语句,分别读取a中的第1,2,3条记录。
        SET b时读取b中的第一条记录,然后输出(x=a3,y=b1);
2. _n_=2,3时,只从b中读取第2,3条记录,分别输出,同时X的值a3自动retain。(x=a3,y=b2) 和(x=a3,y=b3)
3. _n_=4时,试图读取b中第4条记录,而b中已经没有记录可读,data步结束。

data d:
需要注意的是,_n_=1时,执行3条SET语句,都是读取数据集a的第一条记录。所以和data c的区别就是:d的三条记录中x的值都是a1.


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-2-1 19:06:37
楼上的解释比较详细,受教了,set语句用来用去也就那么几种类型,有时候一知半解也不会出问题,都怪自己太较真了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群