raku8731 发表于 2012-10-15 17:20 
我不清楚李宏彬、孟岭生为什么不采用匹配、IV等方法,虽然这些方法都不是完美的,但至少比OLS要好。
计量模 ...
个人感觉这些方法也不一定好。
自然实验咱们就别奢望了。
PSM好像就是一个大杂烩,不管什么变量,倒进锅里就是了。另外,在构建propensity score方程时,用什么变量来解释“是否官二代”?“官二代”是由父母的特征决定的,而不是由孩子内生决定的,想要很好解释这个,可能需要样本 爷爷奶奶的数据。即使这样,匹配的效应也可能会很差。
IV也面临这个问题。什么变量能影响父母当官,而又不影响孩子的收入(是否等同于不影响 父母对孩子能力的培养?)
control Function 也是要对 选择行为(‘是否官二代“)进行刻画。和上面问题类似。
感觉这与一般的估计教育回报面临的样本选择问题不太相同。此文中的样本选择是 样本的父母(或样本的祖父母)根据样本父母的特征作出 是否当官 的选择,因此选择变量与扰动项中(被遗漏的)样本能力因素的因果关系是单向的(选择变量影响 样本能力,但 选择与否 不是根据 样本的能力大小作出的)。
总体来看,方程控制了父母的特征(收入、教育水平等)就够了,不需要对 样本的能力 进行控制(如果父母仅仅是通过这些被控制的父母特征来影响样本的能力)。所以,后面的 高中成绩什么似乎不太重要。
但不知 作者 为什么不 控制 样本是否上211 大学,有实证表明 是否上211大学对 大学生的工资影响相当大。
感觉在可获得变量较少的情况下,OLS甚至要比PSM,IV, control Function(样本选择模型)更稳健,那些方法不一定好,操作起来还麻烦,当然看起来漂亮,可能文章好发些。