下面是最近清理调查数据时候遇到的一个具体问题,希望大家帮忙解决
在抽样问卷中,经常会设置一些filter questions,例如:你在过去12个月内是否工作?此时,如果被访者回答:是,那么接下来会继续问例如工作时间、工资、工作单位等,答案会被记录下来;但如果对这个问题的回答为否,则整个部分会被跳过去,直接进入下一个部分 ,而这些后续问题的答案通常也会被记录为缺省值。
问题是,如果希望删除样本中含有缺省的观测值,这些没有工作的人的整条记录也会被删除,即使这些记录所包含的信息是完整的;而样本中剩下的完全是工作的人,和原来的样本明显不同。我想知道,大家碰到这种情况,通常是如何处理的?多谢