全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
2721 5
2008-04-23

数据结构大致如下。其中Num的数值表示具有相同id的观测值数量。比如,有4个id是7,2个id是21。

          id     Num    Y     X1     X2    X3

  1. 7     4 …… …… …… ……
  2. 7     4…… …… …… ……
  3. 7     4 …… …… …… ……
  4. 7     4 …… …… …… ……
  5. 21   2…… …… …… ……
  6. 21   2…… …… …… ……
  7. 39   3…… …… …… ……
  8. 39   3…… …… …… ……
  9. 39   3 …… …… …… ……
  10. 45   1…… …… …… ……
  11. 53   2… …… …… ……
  12. 53   2… …… …… ……
  13. ………………

现在想把这个大数据按照id分割,具体两个要求。1)让每个id有自己的一个单独数据。2)实现文件名的格式按顺序排列如下:id1.dta (id全是7的),  id2.dta(id全是21的),id3.dta(id全是39)……。由于原始数据非常大,观测值有几十万,因此要编程来完成这个过程。不知哪位高手能指点一下。

(我自己用循环语句只能做到id数值直接来命名,结果既生成了id7.dta  id21.dta, id39.dta,又生产了中间类似id8 id9之类的空数据库。这些空数据库使得下一步我用循环语句对每个数据做xpose时候有missing值,程序无法循环下去)

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2008-4-23 07:05:00

为啥上传了文件看不到?哪位感兴趣留个邮箱吧。关于micro面板的单位根检验,05年的文章。

UNIT ROOTS: IDENTIFICATION AND TESTING IN MICRO PANELS

Stephen Bond
Céline Nauges

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-4-29 11:28:00
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-4-29 22:03:00

将下面代码中的“###”和“@@@”分别改成文件所在目录与文件名,运行即可

cd ####
use @@@@.dta,replace
qui {
  egen grou=group(id)
   sum grou
   global ma=r(max)
   save ab1.dta
   forvalue i=1/$ma  {
        use ab1.dta,replace
        drop if grou!=`i'
        drop grou
        save id`i'.dta
    }
    erase ab1.dta
}

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-4-30 10:40:00
感谢楼上!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-5-1 14:56:00

不用谢!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群