最近遇到类似的问题,我的思路是这样的:
①如果没有年龄变量,先根据出生日期birth生成年龄变量:gen age=2018-birth
②根据你所定义的“儿童年龄”、“老人健康”生成对应变量kid,health进行标记,假设16岁以下定义为儿童,老人健康问卷中应该有对应的变量假设为health
gen kid=1 if age<=16
③根据家庭id进行儿童人数,老人健康的统计:
bys id: egen kid_num=sum(kid)
bys id: egen old_health=sum(health)