我要用CHIP2013的数据做the determinants of rural-to-urban migration. dependent variable 是 migrate or not. 现在数据集里有三个数据包,一个是关于农村人口的,一个是关于流动人口(外出务工),另一个是关于城镇人口的。
现在问题是:
1.农村人口这个数据包里含有是否migrate这个变量,也就是说农村人口里既有外出务工的,也有没有外出务工的
2.流动人口这个数据包里都是农村人口外出务工的
3.对照了一下个人ID, 流动人口不包含在农村人口内
那问题来了,我的分母到底是农村人口还是农村+流动人口
1.如果是农村人口的话,研究的对象就是农村人口里选择外出务工的,经过处理后,回归的结果的系数符号很多都是相反的
2.如果是农村+流动人口的话,研究的对象就是农村数据集里的外出务工人口+流动人口数据。但是流动人口数据包里的变量很少,如果我把农村人口和流动人口合并在一起的话,那我就得把农村人口的一些变量删除掉。
请问有人可以为我答疑吗,感激不尽!