全部版块 我的主页
论坛 计量经济学与统计论坛 五区 数据交流中心
6651 0
2025-08-05

结论先行
以某一年的数值做工具变量(IV)在面板数据里可行,但必须解决随时间不变带来的第一阶段无变化问题。标准做法有三条:

该年值本身只作为截面IV,需要再乘以一个随时间变化的调节变量Bartik 交互);

把该年值当作初始条件,与滞后/差分的时变变量结合,得到时变IV

直接采用该年值的一阶滞后t-1 t-k)充当时序IV,前提满足外生性。

下面给出判定步骤、Stata/R 代码模板及常见误区。





何时可以只用某年值


情形

举例

是否可直接用

需满足条件

纯截面数据

1998 年土地超编人数 → 2015 年土地扭曲

1998 年值与 2015 年扰动项无关

面板数据

1984 年邮电用户数 → 2020 年数字经济

1984 值不随时间变,导致第一阶段 F≈0

面板+Bartik

1984×上年网民增速 当年数字经济

交互项随时间变,F>10





三条可行构造方案(含代码)


方案 A:截面 IV + 时变变量交互(最常用)


stata

* 1984 年邮电用户作为截面 IVgen iv_bartik = tele84 * net_growthivreghdfe y (x = iv_bartik) controls, absorb(id year) cluster(id)estat firststage   // F>10 则通过


方案 B:把某年值当初始条件,差分/滞后


stata

* 1998 年超编人数×(当期机构数-1998 机构数)gen iv_diff = over98 * (institution_t - institution_98)xtivreg2 y x controls (x = iv_diff), fe cluster(id)


方案 C:直接使用该年值的一阶滞后


stata

gen Lx_iv = L.x  // 滞后一期xtivreg2 y x controls (x = Lx_iv), fe cluster(id)


注意:滞后项必须满足外生性——当期扰动项不包含滞后项影响。





必须报告的三项检验



检验

命令

判断标准

第一阶段 F

estat firststage

F>10(弱工具)

不可识别 LM

estat firststage, forcenonrobust

p<0.05

过度识别 Hansen J

estat overid

p>0.1





常见误区提醒

误区 1:直接把 1998 年数值塞进面板模型做 IV → 第一阶段 F 极低。
解决:务必通过交互或差分使其随时间变化。

误区 2:认为历史数据一定外生” → 需论证该年值与当期 ε 无关(政策外生、技术外生)。

误区 3:既做交互又做分组 方法重复,择一即可。





一句话总结
某年值只有与时变动量结合滞后处理后才能成为有效面板 IV,否则第一阶段会失效;写论文时务必给出相关性 + 外生性 + 三项检验的完整证据链。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群