brigittaree 发表于 2012-6-12 12:08 
谢谢你的回答,能给我解释的更具体一点吗,为什么定类变量不能直接参与OLS回归呢,我是不是就按照你所给的赋 ...
如果直接放入定类变量,其系数不好解释。比如说你这里的cap_source假定1表示现金出资、2表示股票出资、3表示固定资产出资,那么直接将cap_source放入回归中,其系数没法解释为cap_source每增加一单位所引起的因变量增加值。所以就没法解释成出资方式每增加一个单位,因变量就变动多少。实际上,不同的出资方式在确定之后,不会变来变去的。对定类变量只能按照不同的类别进行对比分析。
如果按照上贴的方式设置变量,是可以得到想要的结果的。此时假如不考虑其他变量,那么虚拟变量本身就是表示取值为1的组之均值与取值全为零的那一组的均值之间的差异,是表示均值差异程度的。
为何不能直接将定类变量放入方程中?因为定类变量之间没有先后和大小关系,为了解释的方便,也为了逻辑上通顺,不能直接将其放入ols中。不过,如果不考虑解释的问题,单纯从数值估计的角度来看,由于现在的软件通常都用极大似然估计进行优化求解(该估计值与ols估计值相等,且更有效),实际上是可以直接将定类变量放入回归方程中估计的。
总之,单纯的从数值上看,可以将定类变量放入回归方程中,只是产生一个没有任何意义的数值系数。为了解释,为了逻辑上讲得通,我们不能把定类变量直接放入回归方程。