全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 统计软件培训班VIP答疑区
3745 2
2012-12-05

stata manual给出的一个案例中:

Assume that we were to collect data by randomly sampling 10,000 doctors (from 100 hospitals)

and then sampling 10 patients of each doctor, yielding a total dataset of 100,000 patients in a cluster

sample. If in some regression we wished to include effects of the hospitals to which the doctors

belonged, we would want to include a dummy variable for each hospital, adding 100 variables to our

model. areg could fit this model by

areg depvar patient vars, absorb(hospital) vce(cluster doctor)

其中,, absorb(hospital) vce(cluster doctor)的分工体现在,absorb控制了医院的固定效应,vce控制了医生层面抽样的相关性。在式中,其为何不控制医生固定效应?

我目前练习的一个例子中,数据unit为跨国层面的企业数据,我想考察国家层面的某一变量对企业创新的影响,我可不可以只控制国家固定效应,不控制产业固定效应,仅用vce(cluster industry)来控制产业内的企业特征相关性?

另外,我们所说的产业内企业的相关性,是针对于我们所说的y,还是x,还是x,y的组合?

谢谢。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-12-5 10:44:14
在 Stata 手册的例子中,你可以在医生层面,也可以在医院层面进行 cluster,这取决于你对问题本身的分析。如果认为医生之间的行为彼此不相关,而同一个医生所看的病人的所受到的干扰项之间存在相关性,则为 cluster(doctor)。同理,如果认为上述情形发生在医院层面,则可以填写 cluster(hospital)。

在你的问题中,cluster(group) 是在考虑干扰项的相关性的前提下计算系数估计值的方差-协方差矩阵,以便得到更为稳健的统计推断,既不是针对 x 也不是针对 y,而是模型的干扰项。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-12-5 13:07:23
谢谢。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群