全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
1613 12
2016-08-03
悬赏 15 个论坛币 未解决
例如有两个数据集 a和b
a   id   startyear
    1    2005
    2    2003
    2    2005
    3    2002
    ....

b   id   country  startyear
     1     032       2004
     1     056       2006
     1     018       2003
     2     013       2001
     2     057      2003
     2     025      2005
     3     018      2003
     3     025      2004
     4     ....
如上两个数据集,都含有id,startyear代表开始进行某种行为的初始时间。
想得到的数据集:以数据集a为基础,个体1,开始行为时间为2005年,对应数据集b,找出数据集b中id有无在2005年前的数据,有则为1,且统计出个数,如b中个体1有两条在2005年前开始的记录(country为032和018)
want   id  startyear  ex  exnumber
          1    2005       1       2
          2    2003       1       1
          2    2005       1       2
          3    2002       0       0
          4    ....

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-8-3 10:05:52
试试双SET或者proc SQL非等值连接
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-8-3 10:07:22
420948492 发表于 2016-8-3 10:05
试试双SET或者proc SQL非等值连接
能否劳烦您写出程序呢?不大会呢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-8-3 10:08:23
liuliuqiu 发表于 2016-8-3 10:07
能否劳烦您写出程序呢?不大会呢
上传一份样例数据吧
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-8-3 10:23:56
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-8-3 10:25:51
数据量不是很大的话,PROC SQL的效率是没问题的,如果太大可以考虑使用双SET
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群