坏半半 发表于 2012-11-27 07:08 
谢谢你的回复
楼上我跟那个朋友回复了我的一个想法 能否给我些意见,我也觉得那样分开做不对。
这个问题很多人都遇见过。
如果你找的工具变量 a b足够exogenous to error term, 那么回归出来的x2hat肯定是没有内生性了,这是IV工具变量的定义。
第一个问题:a*dummy无法作为x2*dummy的IV。E(error|a)=0 无法推导出E(error|a*dummy)。
第二个问题是:a*dummy无法替代x2×dummy直接回归。这个问题,就如同你无法用工具变量完全替代x2一样。因为x2hat是包含在x2里面、但是又完全exgenous(因为从外生变量bpredict的).
第三个问题,从理论上讲,reg y x1 x2hat dummy1x1 dummy2x1 dummy1x2hat dummy2x2hat,是对的。因为这是2sls的第二步。
不妨回忆一下2sls的最简单形式。
y=a+b*x+e
x是内生的,z是x的工具变量,因此第一步
x=d+f*z+ epsilon
xhat=dhat+fhat*z, or xhat=z'*inv(z'*z)*x
然后第二步
y=a+b*xhat+e
or y=a+*z'*inv(z'*z)*x+e
stata给的ivreress 包,只需要你输入IV即可(即不需要你计算xhat)。