固定效应(虚拟变量）与cluster如何分工?

peyzf

3849

收藏 2012-12-05

在stata manual给出的一个案例中：

Assume that we were to collect data by randomly sampling 10,000 doctors (from 100 hospitals)

and then sampling 10 patients of each doctor, yielding a total dataset of 100,000 patients in a cluster

sample. If in some regression we wished to include effects of the hospitals to which the doctors

belonged, we would want to include a dummy variable for each hospital, adding 100 variables to our

model. areg could fit this model by

areg depvar patient vars, absorb(hospital) vce(cluster doctor)

其中，, absorb(hospital) vce(cluster doctor)的分工体现在，absorb控制了医院的固定效应，vce控制了医生层面抽样的相关性。在式中，其为何不控制医生固定效应？

我目前练习的一个例子中，数据unit为跨国层面的企业数据，我想考察国家层面的某一变量对企业创新的影响，我可不可以只控制国家固定效应，不控制产业固定效应，仅用vce(cluster industry)来控制产业内的企业特征相关性？

另外，我们所说的产业内企业的相关性，是针对于我们所说的y,还是x,还是x,y的组合？

谢谢。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

arlionn

2012-12-5 10:44:14

在 Stata 手册的例子中，你可以在医生层面，也可以在医院层面进行 cluster，这取决于你对问题本身的分析。如果认为医生之间的行为彼此不相关，而同一个医生所看的病人的所受到的干扰项之间存在相关性，则为 cluster(doctor)。同理，如果认为上述情形发生在医院层面，则可以填写 cluster(hospital)。

在你的问题中，cluster(group) 是在考虑干扰项的相关性的前提下计算系数估计值的方差-协方差矩阵，以便得到更为稳健的统计推断，既不是针对 x 也不是针对 y，而是模型的干扰项。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

peyzf

2012-12-5 13:07:23

谢谢。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群