大家好,请问大家,我现在手上有一份家庭关系资料,因研究需要,现希望整理出一份表格,对应每个人在家庭中直系亲属的关系(能明确的则进行整理),示例数据以dataex形式呈现(因涉及隐私故隐匿化处理),希望实现的整理结果如下截图所示,因资料中家庭数较多,无法简单手动一一整理,希望能借助代码尽可能实现,希望大家帮忙出出主意。我目前使用的软件为STATA 16
现遇到的问题:
1)如何基于一整个家庭关系,配对出两两的关系?
2)存在一个户籍地址有多个户主/配偶/……等关系
3)存在无法确认是谁的孩子的情况,对这类人,只对其明确的关系进行匹配(如id10009,不能确定是谁的女儿,则其确定的关系为外祖父母)
我尝试过处理简单的家庭,如家庭中只有配偶、亲子关系,借助duplicates tag,gen()先对家庭中是否有重复的户主、配偶、兄弟姐妹、子女等进行判断,并对不重复者,借助家庭号和角标形式进行整理,但遇到复杂的关系时有困难。由于存在不确定的家庭关系,不能简单按照家庭人数进行循环,需要增加逻辑判断,但不太明白可以怎么处理。
示例代码:
----------------------- copy starting from the next line -----------------------
------------------ copy up to and including the previous line ------------------
希望得到的效果如下,每个人(每个id)
所有明确对应的家庭内的直系亲属关系(其中备注不确定是谁的女儿,但是对应的外孙女-外祖父关系可确定),下图呈现部分整理的关系: