全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 统计软件培训班VIP答疑区
1060 2
2011-08-15
大家好:
      我想将两个数据集合并: 数据集1含有每个家庭成员的信息,数据集2含有整个家庭的信息,两个数据集是按照家庭的编号对应的且可以合并,但是数据集1含有的观测值数量多于数据集2含有的观测值数量. 这样的情况下,我想先将数据集2生成和数据集1对应的重复观测值,然后合并两个数据集. 那么,我应该怎样才能根据数据集1的成员个数生成数据集2的每个家庭的重复观测值呢? 谢谢.

比如:
id             income     expenditure     occupation
110101       1000        300                  manager
110102        2000        500                manager
110201        2003         200               worker
110202        3098         349               official

hh             education   
1101           highschool
1102           middleschool


如何才能把第二个数据集根据第一个数据集的观测值数量来生成两个重复的观测值? 即:
hh      education
1101      highschool
1101      highschool
1102      middleschool
1102      middleschool
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2011-8-15 14:41:18
不用操作的如此复杂,stata可以自动实现你想要的合并功能。
use file1, clear
merge n:1 id using file2
说明:id 是指家庭编号。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-8-15 14:44:30
不用操作的如此复杂,stata可以自动实现你想要的合并功能。
use file1, clear
gen id_str = string(id)
gen hh = real(substr(id_str,1,4))

merge n:1 hh using file2
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群