SAS求教 - 经管之家

SAS求教

liuliuqiu

3292

收藏 2016-08-04

悬赏 15 个论坛币已解决

var	country	startyear
1391910	392	2009
1392010	410	2008
1392061	392	2007
1392061	842	2009
1392321	842	2009
1392390	842	2009
1852990	158	2008
1852990	344	2009
1900120	344	2008
1900120	392	2009
1900120	410	2008

var	country_id	startyear
1391910	392	2009
1391910	410	2008
1391910	842	2007
1392010	410	2008
1392010	392	2007
1392010	410	2009
1392061	392	2007
1392061	842	2009
1392321	842	2009
1392390	842	2009
1852990	158	2008
1852990	344	2009
1900120	344	2008
1900120	392	2009
1900120	410	2008
1900120	528	2004
1900120	458	2001
1900120	484	2003

a 和b 中有 var代表企业，country为出口的国家，startyear为开始对该国出口的时间，想在a的基础上得到在a出口某个country之前，该企业有无出口其他国家的经历，并统计出出口国家的个数。例如企业1391910，在a中，2009年开始向392出口，则看2009年前，该企业是否有出口其他国家的经历，在b中，企业2007年和2008年分别开始出口842和410国家，则有出口经验，且有两个国家。依次类推。。。

最佳答案

吕小布韦查看完整内容

改了下, 应该没问题了

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

吕小布韦

2016-8-4 11:51:36

liuliuqiu 发表于 2016-8-7 09:37
谢谢您！a和b的区别：a仅关注了企业对特定国家的一些出口，而b包括了企业对所有国家的数据，所以b包含了a ...

复制代码

改了下, 应该没问题了

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

liuliuqiu

2016-8-4 13:02:01

各位帮帮忙呀

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

wwang111

2016-8-4 13:11:52

跟刚才的程序差不多，只加了一个是否是‘其他’国家的识别，你看一下哪里还有问题：

data test;
set a;
ex=0;
exnumber=0;
do i=1 to nobs;
set b(rename=(var=var1 startyear=startyear1)) nobs=nobs point=i;
if var=var1 and startyear>startyear1 and country ne country_id then do;
ex=1;
exnumber+1;
end;
end;
drop startyear1 var1 country_id;
run;

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

liuliuqiu

2016-8-4 13:25:02

wwang111 发表于 2016-8-4 13:11
跟刚才的程序差不多，只加了一个是否是‘其他’国家的识别，你看一下哪里还有问题：

data test;

谢谢您，但数据量在400百万+，一直运行不出来，有没有稍简单点的呢？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

wwang111

2016-8-4 13:34:34

liuliuqiu 发表于 2016-8-4 13:25
谢谢您，但数据量在400百万+，一直运行不出来，有没有稍简单点的呢？

我感觉用双set语句已经是效率很高的了，至于有没有效率更高的方法，我也不是很确定，你可以咨询一下论坛里的大牛们；
貌似可以用declare hash实现，但是我不会，以前看其他人发帖子好像有用这种方法解决类似问题的，仅供参考。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

liuliuqiu

2016-8-4 17:46:11

wwang111 发表于 2016-8-4 13:34
我感觉用双set语句已经是效率很高的了，至于有没有效率更高的方法，我也不是很确定，你可以咨询一下论坛里 ...

非常感谢！！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

learsaas

2016-8-4 19:21:35

试试这个:

复制代码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

liuliuqiu

2016-8-4 20:34:05

learsaas 发表于 2016-8-4 19:21
试试这个:

谢谢您！运算的非常快。但结果好像有点问题。假如：
a var  country startyear
1    1       2005
1    2       2007
1    3       2008
b  var    country startyear
   1       1       2005
   1       2          2007
   1       3          2008
   1       4       2003
   1       5       2007
   1       6       2008
结果:a中第一条记录，找2005年前企业1出口的国家数（数据集b中：1       4       2003），a中第二条记录，找2007年前企业出口的国家数（数据集b中有2条记录），依次类推
var  country startyear n
1    1       2005    1
1    2       2007    2
1    3       2008    4

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

liuliuqiu

2016-8-4 20:34:41

learsaas 发表于 2016-8-4 19:21
试试这个:

能否辛苦您再帮忙看看，非常感谢

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

liuliuqiu

2016-8-5 08:58:15

各位大牛帮帮忙吧，现在还没得到结果

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

learsaas

2016-8-5 11:00:06

再试一下这个：

复制代码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

liuliuqiu

2016-8-5 12:23:22

learsaas 发表于 2016-8-5 11:00
再试一下这个：

非常感谢！我刚核对了数据，大部分结果都是对的，只有一小部分有点问题。
例如：企业1第一次对美国出口是2001年，但出口一段时间后退出，第二次进入是2005年。分别统计2001和2005年进入前对多少国家出口。现在的程度能正确统计第一次进入的情况，但第二次甚至更多次进入时的统计结果有误差。
a    var country startyear
   1    美国       2001
   1    美国       2005
b var country    startyear
   1    新加坡       2002
   1       香港          2000
   1    澳大利亚    2003
   1    泰国          2006
   1    美国          2001
result  var country    startyear number
      1    美国       2001       1
      1    美国       2005          3
辛苦您！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

learsaas

2016-8-5 14:38:32

你最好把你原始数据贴出来

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

liuliuqiu

2016-8-5 14:58:57

learsaas 发表于 2016-8-5 14:38
你最好把你原始数据贴出来

老师，您好，由于数据量过大，我只把一小部分数据贴出来了。
大体意思是在a数据集中增加一个变量number，这个变量描述了a和b相同var，不同country，且a中startyear大于b中startyear的个数。谢谢您啦！

a.xlsx
大小:(339.73 KB)

马上下载

b.xlsx
大小:(356.88 KB)

马上下载

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

吕小布韦

2016-8-6 04:48:25

a和b的区别没有说，我理解是这样的，对于a中的一条记录，比如企业=1, 国家=2, startyear=2011, 在b中找到所有企业=1, startyear<2011的记录, 然后统计这里面所有的国家数. 程序如下:

复制代码

id是企业号

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

liuliuqiu

2016-8-7 09:37:50

吕小布韦发表于 2016-8-6 04:48
a和b的区别没有说，我理解是这样的，对于a中的一条记录，比如企业=1, 国家=2, startyear=2011, 在b中找到所 ...

谢谢您！a和b的区别：a仅关注了企业对特定国家的一些出口，而b包括了企业对所有国家的数据，所以b包含了a中所有数据，想统计的是，a中企业对所关注国家出口前，对几个国家出口国。也就是说，统计a、b相同var，不同country，且a.startyear>b.startyear的个数。得到的结果样本量应该跟a中的样本量相同，但现在得到的结果不大对。能否再帮我看一看，谢谢您啦

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

yongyitian

2016-8-7 11:15:39

下面结果中，同一产品（var）第二次进入到同一国家（country）时 n 的值(n=4) 要减去第一次进入时 n 的值 (n=1)

data a;
input var  country startyear;
datalines;
1    1       2001
1    1       2005
; run;
data b;
input var    country_id startyear;
datalines;
   1       2       2002
   1       3       2000
   1       4       2003
   1       5       2006
   1       1       2001
; run;

proc sql;
select distinct a.var, a.country, a.startyear, count(b.country_id) as n
from a left join b
on  a.var=b.var  and  a.startyear > b.startyear
group by a.var, a.country,  a.startyear;
quit;

/* result

var country startyear n
1    1          2001    1
1    1          2005    4

*/

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

jj.ma

2016-8-9 06:09:26

试试这个：

proc sql; /*compare first*/
create table avb1 as
select * from a left join (select country_id, startyear as year from b)
on a.var=b.var where year lt startyear;
quit;

proc sql; /*count countris*/
create table avb2 as
select var, country, startyear, count(country_id) as countris from avb
group var, country;
quit;

proc sort data =avb2 noduprecs out=result; /*list result*/
by var country;
run;

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

zwnSAS121

2017-1-14 23:10:14

复制代码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

zwnSAS121

2017-1-14 23:14:34

这是结果。

附件列表

QQ截图20170114231359.png

原图尺寸 4.56 KB

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

zwnSAS121

2017-1-15 13:01:53

复制代码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

zwnSAS121

2017-1-15 13:03:19

这是最终报表

附件列表

QQ截图20170115130227.png

原图尺寸 8.38 KB

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

最佳答案

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群