全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
5741 11
2009-12-09
请教各位高手:我是用的是CHIP数据(1995和2002),其中在做农村教育收益率的问题时,需要将农村个人数据与家庭数据merge起来,而数据中教育年限考察的是家庭中各成员的,每个成员对应一份数据,同一个家庭中的成员对应一个由省市(a1)和户(b101)两个变量共同组成的家庭代码,而且不同的省会有相同的户的代码(所以确定一个家庭只能由a1和b101共同决定)。
现在我的想法是先把每个家庭中成员的平均受教育年限算出来,形成一个住户平均教育年限表,再去与住户收入表merge,请问这里用Stata命令是怎样的,该如何处理?
还有没有更好的办法?
我是stata的初学者,请各位赐教!!谢谢了!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2009-12-9 00:43:37
我有尝试过用tabstat b110a  if a1==110221 & b101==101
(其中b110a为个人受教育年限, a1为省市代码(110221为其中的一个),b101为户代码)
但这样仅处理了一户,数据中共有7000多户,有没有对应的循环命令之类的?
我没学过编程,所以学这些命令都很慢很费劲,现在看的都还是基础。但急于要弄这个,所以只好求助大家,谢谢了!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-12-9 09:10:37
这个需要贴出一个数据片段,根据数据来设计。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-12-9 13:54:27
首先根据省代码和户代码建立连接变量连接两个数据库:egen unique_id=concat(province household)
merge

然后算出每户的人口数:   bysort unique_id: gen id=_n

然后机关家庭平均教育水平: bysort unique_id: egen mean_education=mean(b110a)

然后保留家庭中的第一个样本: keep if id==1
                                                          drop id
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-12-9 21:38:56
这是我要用的数据,CHIP1995的农村个人和家庭调查
谢谢!
3# sungmoo
附件列表

CHIP1995.rar

大小:2.9 MB

 马上下载

本附件包括:

  • 03012-0001-Data.dta
  • 03012-0002-Data.dta
  • Chinese Household Income Project, 1988 .pdf
  • CHIP(1995) descriptioncitation.pdf
  • CHIP(1995) Questionnaire.pdf
  • CHIP(1995)Codebook.pdf

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-12-9 21:48:47
lolo2xj 发表于 2009-12-9 00:37 现在我的想法是先把每个家庭中成员的平均受教育年限算出来
求平均值的分母是什么?(比如,每户全部人口?每户满足一定条件的全部人口?)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群