`vce(robust)`和`vce(cluster id)`是两种不同的标准误估计方法,它们的主要区别在于处理异方差和自相关的方式。
- `vce(robust)`, 即稳健(Huber/White/sandwich)标准误。这种方法假设误差项的方差可能在观察中变化(即存在异方差性),但并不考虑群集内的相关性。使用此方法时,回归系数的标准误被调整以反映潜在的异方差,从而使得置信区间和显著性检验更为准确。
- `vce(cluster id)`, 即簇状标准误或聚类稳健标准误(clustered robust standard errors)。这种方法不仅考虑了可能存在的异方差,还进一步假设数据在某些“群集”内部可能存在相关性。例如,在DID模型中,“id”通常是单元标识符,这意味着同一单元(如个体、公司)在不同时间点的观测值可能相互关联。“vce(cluster id)”会计算这种簇状内的自相关,并对标准误进行相应的调整。
为什么回归结果会有差异:
- 当使用`vce(robust)`时,假设了各个观测间是独立的。如果这个假设不成立(即存在群集内自相关),则可能低估了标准误,使得t检验和p值看起来比实际情况更显著。
- 而`vce(cluster id)`通过考虑群集内部的相关性,通常会给出更大的标准误估计,这可能导致原本看似显著的系数在调整后变得不显著。
至于“* = FE nested within cluster; treated as redundant for DoF computation”这一信息:
当你在模型中同时使用了固定效应(`absorb(id year)`)和簇状标准误时,这部分提示意味着:由于固定效应对id和year已经进行了控制,再对这些类别内的观测进行聚类调整,不会额外增加自由度估计的复杂性。因此,在计算自由度时,“id”和“year”的吸收被视为已考虑在内,且是冗余的信息。
在选择`vce(robust)`还是`vce(cluster id)`时:
- 如果数据中有明显的群集结构,并且你预计群集内部的观测值可能存在相关性,则应使用`vce(cluster id)`.
- 反之,如果认为各观察独立或异方差是主要关注点而无显著群集效应,则可以考虑使用`vce(robust)`。
总之,在实际应用中,选择哪种标准误估计方法应当基于你对数据生成过程的理解和模型假设的合理性质。通常情况下,当存在潜在的群集内自相关时,`vce(cluster id)`更推荐使用以获得稳健且正确的推断结果。
此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用