大家好,我想做一个有关独生子与教育获得的定量分析,数据来源是CSS2011。使用Stata过程中遇到了一个问题:我要考察父/母亲的教育程度作为控制变量对模型的影响,但数据中没有直接的变量提供分析,需要对多组样本进行整合。无奈自己才疏学浅,一时不知如何下手(试了试merge,但还是没搞懂具体怎么操作)。
具体来说,问卷中有两项题器对此进行了测量:
A1a题“首先,请您告诉我您家有几口人?他们和您是什么关系?”,其中受访者会在不同答题序列中选择“本人父母”进行填答;
针对未在A1a题中对父母情况作出说明的受访者,A1b题又对其进行了补充提问“请您告诉我,您的父母及配偶父母的一些简单情况”。
A1a的问卷结果在编码时最后生成了15组有关受访者家庭关系的信息变量(每个组别里,需要用的有:亲属关系类型、性别、教育水平)
A1b题的结果编码就比较简单,直接就有父亲教育程度与母亲教育程度。
请教大家,要如何把A1a和A1b中的数据合并,生成一个有关全体样本的“父亲教育程度”与“母亲教育程度”呢?
希望我的表述足够清楚,还望大家指点!多谢!