今日问题与答案1
计量实证社区的老师:
您好!我最近在使用heckit调整mincer方程的样本选择偏误时遇到两个问题特来请教。(1)一般在构建工资方程时会加入职业,所有制等等在参与工作后的人群中才能观测到的变量。但是heckit第一阶段的选择方程中要求加入第二阶段所有变量和其他可能影响了个人参与劳动力市场的外生变量,那么要如何处理那些在不选择工作的人群中无法观测的变量呢?(2)另一个问题是关于微观数据库的。一般调查时会问的是去年的工资和现在是否工作。这就导致有可能前一个问题大于零的后一个问题答复没有工作,或者相反。这种情况下如何选择heckit方程第一阶段的因变量?
问题1答案: (1) 如果是我做的话,我会把职业、所有制等变量从工资方程中剔除。主要原因不是因为这些变量对于不工作的人不可观测,而是这些变量很可能是比较内生的变量(工资、职业、所有制等工作本身的特征可能是在工作搜寻过程中同时被决定的),因此不适合加入自变量。相比之下,明瑟方程中传统的自变量(教育、年龄等)会相对外生。(2)有两种处理方法。第一,只看去年,并且根据去年的工资等信息判断受访者去年是否在工作。第二,只看今年,拿去年的工资做今年工资的代理变量,或者根据去年工资和受访者其他特征预测出今年的工资(这个可能更准确);对于今年不工作的,工资取0或缺失值。