全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
3345 5
2014-12-12
我有很多公司,面板数据,ID是不同公司,时间是年度。不平衡面板,有的公司有10(比如从2000-2010)年的数据,有的公司有7年、8年、9年等的数据,不等。我怎么筛选出有连续10年数据的ID(公司)组、有连续9年数据的ID(公司)组、有连续8年数据的ID(公司)组、---、有连续1年数据的ID(公司)组?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-12-12 14:11:17
duplicates tag id year,gen(count1)
replace count1=count1+1
browse if count1<=4
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-12-12 15:50:46
ermutuxia 发表于 2014-12-12 14:11
duplicates tag id year,gen(count1)
replace count1=count1+1
browse if count1
多谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-12-12 23:43:34
disertation 发表于 2014-12-12 15:50
多谢!
经测试,duplicates tag id year,gen(count1) 的作用是给id和year 组合记录打上标识,并产生一个新变量count1,默认值是0, replace count1=count1+1 将count1的值由0变为1,browse if count1<=4,条件count1<=4永远成立,因为count1通过 replace count1=count1+1值变为了1,永远小于4,故条件没有特别意义,br if count1<=4等同于 browse.
如果想浏览count1==11或n(1<n<11)的数据,该如何实现呢? browse if count1==11 或br if count1==n,但关键是count1的值只等于1,无法随id和year组合值的增加而增加,该如何解决呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-12-13 00:02:57
disertation 发表于 2014-12-12 23:43
经测试,duplicates tag id year,gen(count1) 的作用是给id和year 组合记录打上标识,并产生一个新变量cou ...
通过 tabulate id 可以看到 id 的频度(依year),id的频度包括10、9、8、7、6、5、4、3、2、1,如果只想查询 id频度为8的数据,如何实现?  
browse if  id频度 ==8,关键是“ id频度” 如何表示,有没有某变量频度函数可直接取某变量的频度信息?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-12-13 08:05:33
disertation 发表于 2014-12-12 15:50
多谢!
真心感谢!此是正解。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群