大家好:
我想将两个数据集合并: 数据集1含有每个家庭成员的信息,数据集2含有整个家庭的信息,两个数据集是按照家庭的编号对应的且可以合并,但是数据集1含有的观测值数量多于数据集2含有的观测值数量. 这样的情况下,我想先将数据集2生成和数据集1对应的重复观测值,然后合并两个数据集. 那么,我应该怎样才能根据数据集1的成员个数生成数据集2的每个家庭的重复观测值呢? 谢谢.
比如:
id income expenditure occupation
110101 1000 300 manager
110102 2000 500 manager
110201 2003 200 worker
110202 3098 349 official
hh education
1101 highschool
1102 middleschool
如何才能把第二个数据集根据第一个数据集的观测值数量来生成两个重复的观测值? 即:
hh education
1101 highschool
1101 highschool
1102 middleschool
1102 middleschool