全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
35228 18
2015-03-04
如果原始数据中受教育程度是这样表示的:1 文盲/半文盲 2 小学 3 初中 4 高中/中专/技校/职高 5 大专 6 大学本科 7 硕士 8 博士,那么在回归方程中能不能直接用这些数值表示受教育程度?还是必须要构建虚拟变量或者转换为受教育的年限?


感觉应该是不行的,但万一行呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-3-4 17:52:49
应该是需要设置虚拟变量
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-3-4 22:15:13
变量粗略分三种:间距变量、比例变量、分类变量。
间距变量:数值能体现出相互之间的差距,相加减都有意义
比例变量:除了满足以上,还满足相除有意义,身高体重都不是比例变量,因为谁是谁体重身高几倍或者一点几倍没有意义。
分类变量:数值不能体现出相互差距。

受教育程度就属于分类变量。它只有类别的意义,你把他们命名为1-8,这并不能说明小学和文盲的差距与小学和初中的差距是相同的,后面也一样,他们之间的差距是不同的甚至不可衡量的;更不能说明高中和小学的差距是小学和文盲的差距的两倍。
如果你在做回归的时候把他们赋值为1-8,那么就会有上述的意义。解释的时候,你就要讲,当教育程度增加1时,收入(比如说)增加多少;增加2时又怎样。或者教育程度增加百分之1时怎样怎样,这些都是很荒谬的。
因为从小学跳到高中和从高中跳到大学虽然都是加一,但是差距不一样,造成的效果也不同。
所以,你应该做7个虚拟变量,不能用8个,为防止完全共线性。然后把这7个变量加进去。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-3-4 23:24:59
一般研究教育时候都是将它们处理成教育程度(高中低)的虚拟变量;
或者按照受教育程度赋值:文盲=0;小学=6;初中=9;高中(职高,中专)=12;大学专科=14;大学本科=16;硕士及以上=19。这样就转化成了数值型变量。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-3-5 14:09:19
o梧桐叶落o 发表于 2015-3-4 22:15
变量粗略分三种:间距变量、比例变量、分类变量。
间距变量:数值能体现出相互之间的差距,相加减都有意义 ...
您好,再问一个问题哈

我按您的方法得到以下的结果(以文盲/半文盲为基准组),那么比较不同受教育程度对于因变量的影响是不是只要比较相应系数的大小就可以了?比如说_Idiploma_3的系数比_Idiploma_2大,是不是可以说明初中对因变量的正向影响比高中大?

                         Coef.
_Idiploma_2        0.07**
_Idiploma_3        0.19***
_Idiploma_4        0.21***
_Idiploma_5        0.22***
_Idiploma_6        0.25***
_Idiploma_7        0.23
_Idiploma_8        0.08

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-3-14 00:32:05
cherry_wyj 发表于 2015-3-5 14:09
您好,再问一个问题哈

我按您的方法得到以下的结果(以文盲/半文盲为基准组),那么比较不同受教 ...
对,是这样。
值得一提的是,7和8不显著,尤其是7系数还比较大。可能是因为标准差比较大,看了一下编号,是硕士和博士,那么在你的样本里面这两组的数量应该是很小的,那么在硕士和博士里面变异性就不是很大,就会导致这种状况。解释这两个系数的时候应该谨慎。一个可能的办法是把7和8合成一组(硕士或博士),可能会靠谱一点。

另外,说一下,上面那位仁兄说把教育程度转化成教育年数。这里有两个问题:
1. 4、5、7、8的教育年数是不确定的。比如硕士有专业硕士和学术硕士,我国专业硕士一般是2年,学术硕士一般是3年。而国外,比如MFE有1年,也有1年半的。至于高职、技校、大专、中专这些也都是不确定的。
2. 你的原始数据是教育程度并不是教育年数,从年数上讲是不连续的,转化成教育年数还是会导致变异性不大的问题,而且你转化成的教育年数包含的信息实际上和以前一样多。另外,拿到这个学历并不代表在这之后他没有进一步读书,只是没拿到文凭而已。(当然,你可以说一种观点是“教育是不可分的”,尤其是对于信号作用比较大的部门或者深信此理论的人)不过,一般来说,不建议那样做,除非真的有什么特殊要求要得到以年为单位的结果而又无法得到更精确的数据。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群