全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
2097 2
2022-07-20
跟大家探讨一下cluster在什么层面的问题

是个老话题了,聚类内部的个体残差相关,但聚类之间不相关,微观计量必备。我的问题描述如下:
我研究2015-2019年省级层面的市场化进程滞后导致该省劳动力流失,数据是劳动力个体微观数据。解释变量是劳动力户籍地省级市场化进程,估计的标准误应该cluster在哪个层面比较合适,我有三个选择:A.户籍地省份(25个);B.劳动力流入的城市(290个);C.劳动力流入的省份(31个)。我默认做法是B,但被质疑应该用A。
这三个不同cluster计算的系数标准误差别挺大,现在跟大家探讨一下哪个更合适,关系到关键系数估计的稳健性。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-7-20 16:58:24
一般聚类到与核心解释变量同层级比较合适,当然这是一般情况下的建议
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2024-10-15 15:11:11
在决定标准误进行聚类校正的层面时,重要的是理解误差项的相关结构。在这个案例中,你正在研究省级市场化进程对劳动力流失的影响,并使用了劳动力个体微观数据。解释变量是基于劳动力户籍所在地的省级市场化进程水平。

1. **户籍地省份(A)**:选择在户籍地省份进行聚类校正是合理的,因为同一省份内的劳动力可能受到相似的经济、社会和政策环境影响,这可能会导致误差项的相关性。由于你的解释变量也是基于省份级别定义的,因此在这个层面进行聚类可以更准确地反映模型中的异质性和相关性。

2. **流入城市(B)**:在劳动力流入的城市层面上进行聚类校正可能过于具体,除非你有理由相信同一城市的个体之间存在显著的相关性。如果城市的经济状况、就业市场或社会网络对个人决策有重要影响,则这种聚类可能是合理的。

3. **流入省份(C)**:在流入省份的层面进行聚类可以捕捉到与流入城市类似但更广泛的效应,考虑到省内的城市间可能存在相似的影响因素。然而,如果主要关注户籍地省级市场化进程的影响,这可能不如户籍地省份的聚类直接相关。

鉴于你的研究焦点是户籍地省级市场化进程对劳动力流失的影响,选择**A. 户籍地省份进行聚类校正可能是最合适的**。这样可以更好地反映由于共同经济和社会环境而产生的个体间误差的相关性,同时确保估计的标准误更准确地反映了模型的不确定性水平。

当然,在报告结果时,建议也提供其他聚类方式下的稳健性检验(如B和C),以显示你的核心发现对于不同的标准误校正方法是稳定的。这样可以增加研究的可靠性和说服力。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群