全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 悬赏大厅 求助成功区
6182 6
2022-04-14
悬赏 5 个论坛币 已解决
本人计量小白,在处理数据时发现了样本选择偏误,我的Y是就业水平,用劳动报酬衡量,然而失业人员并不在我研究样本的考察之内,所以查阅资料需要用heckman两步法做稳健性检验。

但是我的问题是,我的样本全部是就业样本,没有包含失业人员,所以第一步设置虚拟变量时都设置成1(inlf=1),这样的话结果就报错了(Dependent variable never censored because of selection: model would simplify to OLS regression)


所以请教大家该怎么做?是我理解有问题吗?

最佳答案

18383810951 查看完整内容

因变量都是1确实不太行,若想设置成虚拟变量。 可以把因变量按照年度行业均值(或年度行业中位数)设置为二元变量,即高于年度行业均值(中位数)设置为1,否则为0。 步骤(以年度行业均值为例): bys industry year:egen mean就业水平=mean(就业水平) gen 就业水平虚拟变量=1 if 就业水平> mean就业水平 replace 就业水平虚拟变量=0 if 就业水平虚拟变量==.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-4-14 08:45:14
因变量都是1确实不太行,若想设置成虚拟变量。
可以把因变量按照年度行业均值(或年度行业中位数)设置为二元变量,即高于年度行业均值(中位数)设置为1,否则为0。
步骤(以年度行业均值为例):
bys industry year:egen mean就业水平=mean(就业水平)
gen 就业水平虚拟变量=1 if 就业水平> mean就业水平
replace 就业水平虚拟变量=0 if 就业水平虚拟变量==.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-14 11:20:29
因为查阅资料没法看到其他人的数据结构,实在不知道这个虚拟变量如何设置,按照我的理解,因为样本选择偏误所以导致那些失业人员是不在样本中的,理所当然这个变量就都为1了,但是第一步直接报错,意思是说我没有设置0吗?可是正因为没有0变量才存在的选择偏误呀,陷进去了。。。。求大佬帮忙解答,不胜感激
outcome does not vary; remember:
                                  0 = negative outcome,
        all other nonmissing values = positive outcome
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-14 18:19:46
heckman两步法的第一步的Y必须是1,0的虚拟变量。你把数据全做成就业样本,也就是虚拟变量的1,而没有包含失业人员,也就是虚拟变量的0,的处理是你出现错误的根本所在。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-14 18:26:49
anm10493 发表于 2022-4-14 18:19
heckman两步法的第一步的Y必须是1,0的虚拟变量。你把数据全做成就业样本,也就是虚拟变量的1,而没有包含 ...
谢谢您的解答,我已经认识到这个问题了,所以现在不知道如何处理,还是说我这个问题用PSM已经可以解决了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-14 18:34:28
18383810951 发表于 2022-4-14 16:34
因变量都是1确实不太行,若想设置成虚拟变量。
可以把因变量按照年度行业均值(或年度行业中位数)设置为 ...
谢谢您的解答,还想请教一下是否有文献有类似的处理方法,因为这样虽然能出结果,但是我不知道这样设置到底有没有道理,因为这样设置出来的0的那些样本说明了什么呢?跟失业好像也没什么关系。。。如果我理解错了还请您赐教
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群