可以采用 center 命令去除城市和产业效应后,在对精简数据执行 OLS 估计。
原理很简单。比如,在模型 Y = a + b1*x + b2*d + e 中,d 为虚拟变量。我们可以先算出 d=0 和 d=1 两种情况下的 Y 和 x 的组内平均值 Y_mean 和 x_mean,进而计算出离差 (Y-Y_mean) 和 (x_mean),然后估计如下模型即可:
(Y-Y_mean) = a + b(x-x_mean)。这也是 Stata 中固定效应模型的估计方法。
具体的操作过程如下:
bysort industry: center y x1 x2 x3, replace // 去除行业效应
bysort city: center y x1 x2 x3, replace // 去除城市效应
reg y x1 x2 x3