全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
5038 5
2021-12-24
STATA小白一个,想问一下大家,CFPS的成人问卷数据中只想保留16-30岁的人及其家庭成员的数据,该如何操作?

目前只会提取出16-30岁人的数据,但是不知道如何把这一群人的家庭成员(如父母)数据给匹配并保存下来。

谢谢~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2021-12-30 15:22:37
利用famconf中的对应关系,使用-merge-命令匹配
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-1-13 11:42:27
Raymond.K 发表于 2021-12-30 15:22
利用famconf中的对应关系,使用-merge-命令匹配
好的,谢谢你!我去试一试
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-6 22:21:59
请问您找到具体解决方法了吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2024-4-20 23:05:39
请问您找到具体解决方法了吗
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2024-11-1 15:04:18
在CFPS (China Family Panel Studies) 数据集中,个人问卷和个人的家庭成员信息是通过“家户ID”和“关系ID”链接的。具体来说,每个受访者都有一个唯一的家庭标识(通常是hhid),这个标识可以帮助我们识别同一个家庭中的其他成员。

要将16-30岁的人及其家庭成员的数据提取出来并保存,你可以按照以下步骤在STATA中操作:

1. **加载数据**:首先,你可能需要加载两个数据集:一个是个人问卷数据(通常是`adult访视`),另一个是家庭成员数据(可能是`fam_mem访视`)。假设你的文件名分别为 `adult.dta` 和 `family_member.dta`。

   ```stata
   use "adult.dta", clear
   use "family_member.dta", clear
   ```

2. **选择16-30岁的人**:在个人数据集中,筛选出年龄范围内的受访者。假设年龄变量是 `age`。

   ```stata
   keep if age >= 16 & age <= 30
   ```

3. **保留家庭成员信息**:现在你有了一群特定年龄段的受访者的数据。接下来需要做的是找到这些人的家庭成员的信息。首先,你需要确定哪些变量在两个数据集中用来链接同一个家户内的不同成员(比如`hhid`)。假设我们使用 `hhid` 和 `pid`(个人ID)作为连接键。

   ```stata
   // 假设你已经加载了 family_member.dta
   merge m:1 hhid pid using "adult.dta"
   ```

   这个命令会根据共同的`hhid`和`pid`将两个数据集合并。注意:如果你的数据集中没有个人ID,那么可能只使用`hhid`就足够了。

4. **保存结果**:最后一步是保存你的新数据集。假设你想把它命名为 `selected_data.dta`。

   ```stata
   save "selected_data.dta", replace
   ```

这样,你就成功地提取出了16-30岁的人及其家庭成员的数据,并将它们保存在了一个新的数据集中。如果你的变量命名或数据结构有所不同,请根据实际情况调整上述代码中的变量名和命令。
   
以上步骤应该能帮助你实现目标,但请记得,在处理真实数据集时,首先检查数据文档以确定正确的变量名称和链接方式。

如果在实际操作中遇到问题,比如变量名不匹配或者数据格式不同,你需要参照CFPS提供的数据手册进行适当的调整。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群