全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
4077 4
2012-02-22
各位,请教一下,我的数据分为五类:小学及以下,初中,高中,中专技校,以及大专及以上。我为此建立了以小学及以下为基准的四个虚拟变量,做probit回归时,提示出现共线性,这是怎么回事呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-2-22 17:35:57
一|作为连续变量处理,解释为教育
二、如果要关注处理效应,则匪类为小学,初中、大学三类,使用recode
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-2-22 19:17:30
已经处理为分类变量了。变量edu是小学及以下为1,其他分别为2,3,4,5.于是比如对2,我的命令是:gen edu2=1 if edu==2,replace edu2=0 if edu==1,其他都是这么处理,建立四个虚拟变量,请问我是哪里出了问题?谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-2-22 21:17:10
这个问题我也曾经遇过! 经验是这要看您的资料,您说的五类里,
肯定有的教育层级的比例特别特别少,或者两教育层级的比例很类似很类似。

我个人认为jannsz06提供处里的方式很好,您应当可以试试看

他的第一个建议,意思是建议您教育变数当作连续变量处理,或许您可以使用"受教育年数"这样的变量,
不过这有缺点,因为基于这个变量求出的边际效果意思增加一年教育,造成就业可能的力量有多少。
【假设您做的是就业与否的probit回归】
但比较无法明显看出大学相对小学及其以下的效果…

他的第二个建议是,您再重新分类啦!
五类变三类,说不定您的共线问题就不存在!

最后,我看不太懂您用的命令,一般我们不习惯您那样的作法,一些方法请参见
https://bbs.pinggu.org/thread-1355897-1-1.html

特别是sungmoo大大的做法很值得学习,他已对诸多命令炉火纯青!堪称艺术 ∧∧
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-2-22 21:28:00
十分感谢,我再看看
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群