不是面板数据可以用双向固定吗
结论先行
“不是面板数据”≈缺少“个体 × 时间”二维重复观测,就无法也没必要做“双向固定效应”(Two-way FE)。
如果硬把截面数据当成面板、人为造出“个体+时间”两维,会立刻掉进“伪重复、虚假自由度”陷阱,t 值膨胀,估计不一致。
下面把道理、例外与替代方案一次说清。
1 双向 FE 的数学前提
y_it = α_i + γ_t + βX_it + ε_it
必须有 i(个体)和 t(时间)同时出现多次,才能分别估计 α_i、γ_t 两个高维虚拟变量集。
截面数据只有 i 没有 t(或只有 t 没有 i),或者每个 i 仅出现一次,α_i 与 γ_t 之一必然与常数项完全共线,Stata 会直接 drop。
2 常见“假双向”误区
- 误区1:把“省份”当个体,“年份”当时间,但每个省份只有一年数据 → 每格 (i,t) 仅 1 条记录,等价于截面,无法区分 α_i 与 γ_t。
- 误区2:把“公司+月份”硬拆成面板,但公司只被观测一次 → 同样无法估计公司 FE。
结果:软件会报告“omitted”或“singleton groups”,估计其实退化成单向 FE 甚至 OLS。
3 唯一可讨论的“近似”场景
数据不是经典长面板,但满足:
- 短而平衡:n 很大、T=2(前后两年),可勉强估计双向 FE,前提是每 (i,t) 都有记录;
- 或“重复截面”(repeated cross-section):每年样本不同,没有 i 的追踪,此时只能做“年度 FE”(γ_t),无法做个体 FE,更谈不上双向。
4 截面数据想“控制”双向异质性,怎么做?
- 单向 FE 足够:
– 有空间维度(省份、行业):areg y x i.province, absorb(province)
或 reghdfe x, absorb(province)
– 有时间维度(年份、季度):reg y x i.year
- 若担心“省份×年份”共同冲击,用交互固定效应(province×year 虚拟变量)或交互线性趋势(province#c.trend),而非“双向 FE”。
- 更高级:Correlated Random Effects (CRE)、多way clustering、Driscoll-Kraay 标准误,但仍是“截面技术”,不冒充面板。
一句话
没有“个体–时间”重复观测,就别强行“双向固定”;
截面数据里想控制“地区+时间”异质性,用“地区FE + 年份FE”或“地区×年份FE”即可,不要宣称自己做的是 Two-way FE,审稿人一眼就能看出来。