夏目贵志 发表于 2013-3-2 23:10 
也许会存在这个问题。因为你选择样本的方式(选择就业途径不为4的样本)并非与收入独立。至于具体怎么处理, ...
谢谢回复!可否继续追问?
具体是这样的,数据本身包含:就业途径=1强关系,2弱关系,3社会组织,4自己找的。但我的研究主题是“就业支持”,只涉及到前三个选项,第4不符合主题需要,所以故意缺失。一开始我以为不存在样本选择问题。
想要分析的职业阶层是那些选择1,2,3就业途径的样本个体,然后看这些个体的职业阶层对收入的影响,所以目标方程即结果方程是职业阶层和收入的因果关系。因为就业支持与收入有关,但是假定它一定是间接影响收入,所以作为工具变量。
lnDwage_(i )=β_0+β_1 O_i+β_2 X_i+β_3 S_i+ε (1) 收入方程
O_(i )=γ_0+γ_1 E_i+γ_2 X_i+γ_3 S_i+μ (2) 职业选择方程
O_i职业阶层,E_i就业支持途径, X_i和S_i分别是控制变量。
我看书上案例说的是职业选择方程的选择性问题,比如是否就业,就业=1时,分析的样本不包括就业=0的,因而用选择模型。
这样的话我的研究问题是不是还存在样本选择问题?
谢谢您宝贵的时间!