全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
14997 5
2012-06-12
悬赏 50 个论坛币 已解决
论文外审回来有一条意见是:作者在计量建模过程中产生了一个比较明显的错误,文中Cap_Source虽然是控制变量,但由于是定类变量,不能直接在OLS模型中进行回归分析,对此问题应采用设立虚拟变量的方式进行修正
计量统计真是没学好,所以也不怎么懂,之前在别的文献中也看到定类变量参与OLS回归的,难道说定类变量不可以参与OLS回归吗?设立虚拟变量进行修正是什么意思,需要将这个定类变量转化为虚拟变量吗,还是怎样处理?我的Cap_Source变量属于多分类变量,按类别赋值1、2、3.

请高手帮忙解答,真的是万分感谢!

最佳答案

bonjovian 查看完整内容

对的,按照上述赋值方法,根据cap_source的取值重新设置两个虚拟变量,加入到回归中去即可。cap_source不要再放入。虚拟变量相当于取值为1的组与在所有虚拟变量中都取值为0的组相对比。如根据前面的赋值规则,cap1=1表示cap_source=2这一组与cap_source=1这一组的对比;cap=2表示cap_source=3这一组与cap_source=1这一组的对比。 定类变量为啥不能直接回归?打个比方,因为定类变量不连续,比如说有三类,那么在坐标轴上只有3个 ...
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-6-12 04:06:07
brigittaree 发表于 2012-6-12 12:08
谢谢你的回答,能给我解释的更具体一点吗,为什么定类变量不能直接参与OLS回归呢,我是不是就按照你所给的赋 ...
对的,按照上述赋值方法,根据cap_source的取值重新设置两个虚拟变量,加入到回归中去即可。cap_source不要再放入。虚拟变量相当于取值为1的组与在所有虚拟变量中都取值为0的组相对比。如根据前面的赋值规则,cap1=1表示cap_source=2这一组与cap_source=1这一组的对比;cap=2表示cap_source=3这一组与cap_source=1这一组的对比。
定类变量为啥不能直接回归?打个比方,因为定类变量不连续,比如说有三类,那么在坐标轴上只有3个点。这种变化无法通过回归反映。而设置虚拟变量的好处就是从上面三类中选择一类作为基准,然后跟这一基准进行比较,从而反映组与组之间的差异。虚拟变量的系数值就是虚拟变量取值为1的组与基准组之间的均值差异;t值显著的,表示这两组之间的差异是具有统计显著性的~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-6-12 06:50:18
通常虚拟变量的设置个数=分类数-1。这里可以考虑设置2个虚拟变量:
虚拟变量1 cap1=1 当cap_source=2 , cap1=0 当cap_source=其他;
虚拟变量2  cap2=1 当cap_source=3 , cap2=0 当cap_source=其他;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-6-12 12:08:39
谢谢你的回答,能给我解释的更具体一点吗,为什么定类变量不能直接参与OLS回归呢,我是不是就按照你所给的赋值方法,根据现有的cap_source赋值重新给两个虚拟变量赋值,然后再参与回归?麻烦再给我解答一下吧,非常非常感谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-6-21 21:42:38
brigittaree 发表于 2012-6-12 12:08
谢谢你的回答,能给我解释的更具体一点吗,为什么定类变量不能直接参与OLS回归呢,我是不是就按照你所给的赋 ...
如果直接放入定类变量,其系数不好解释。比如说你这里的cap_source假定1表示现金出资、2表示股票出资、3表示固定资产出资,那么直接将cap_source放入回归中,其系数没法解释为cap_source每增加一单位所引起的因变量增加值。所以就没法解释成出资方式每增加一个单位,因变量就变动多少。实际上,不同的出资方式在确定之后,不会变来变去的。对定类变量只能按照不同的类别进行对比分析。
如果按照上贴的方式设置变量,是可以得到想要的结果的。此时假如不考虑其他变量,那么虚拟变量本身就是表示取值为1的组之均值与取值全为零的那一组的均值之间的差异,是表示均值差异程度的。
为何不能直接将定类变量放入方程中?因为定类变量之间没有先后和大小关系,为了解释的方便,也为了逻辑上通顺,不能直接将其放入ols中。不过,如果不考虑解释的问题,单纯从数值估计的角度来看,由于现在的软件通常都用极大似然估计进行优化求解(该估计值与ols估计值相等,且更有效),实际上是可以直接将定类变量放入回归方程中估计的。
总之,单纯的从数值上看,可以将定类变量放入回归方程中,只是产生一个没有任何意义的数值系数。为了解释,为了逻辑上讲得通,我们不能把定类变量直接放入回归方程。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-7-20 14:16:16
bonjovian 发表于 2012-6-21 21:42
如果直接放入定类变量,其系数不好解释。比如说你这里的cap_source假定1表示现金出资、2表示股票出资、3表 ...
谢谢您的回答,但我还是没看懂这个赋值咋操作的?能说下具体咋操作这种赋值的吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群