全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
8657 5
2014-07-24
      本人是第一次用STATA,向各位请教一个问题。
      现有3列数据,数据类型是long,在3个文件里(当然我也可以把它们都复制到同一文件中)。随便举个例子,数据如:
      var1               var2              var3
      2342334        2342334       7823213
      2342244        2354632       4532213
      123454          54324           2342334
      54324                                 54324
      3245432
      233444
      每一列的长度都不一样,最长的一列有1000万个数据。我现在需要把3列里都有的数据找出来,也就是找出它们的交集,请问用STATA怎么实现?
      原本用EXCEL做事很容易的,但数据太多了,超出了EXCEL的处理范围,所以只能用STATA了。
      第一次发帖,还请各位高手赐教!   
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-7-24 11:14:54
贴到一列然后duplicate命令标记,3的就是
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-7-24 13:42:52
wfldragon 发表于 2014-7-24 11:14
贴到一列然后duplicate命令标记,3的就是
能详细点吗?我是新手,谢谢啦!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-7-24 15:55:56
我现在需要把3列里都有的数据找出来,也就是找出它们的交集
loc n=_N
set ob `=3*_N'
replace var1=var2[_n-`n'] if _n>`n'&_n<=2*`n'
replace var1=var3[_n-2*`n'] if _n>2*`n'
duplicates drop var1, force

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-7-24 16:24:52
已经搞定,谢谢各位
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-3-23 21:21:19
fujingchi 发表于 2014-7-24 16:24
已经搞定,谢谢各位
楼主,请问是怎么搞定的呢?谢谢啦
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群