全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 统计软件培训班VIP答疑区
14909 1
2014-10-06
连老师,我看有些文章中一些控制变量取对数之前,都会对原始值加1,我也尝试解释为什么作者会这么做,估计是该变量等于零的较多,如果直接取对数,就会有很多缺失值的缘故,但是我想请教您:1、这种变换方法是不是人为改变太多,会造成数据失真呢?
2、另外,如果原始值加1取对数转换方法确实合理的话,对于核心变量,也可以加1之后取对数么?不知道这样做的话其他审稿人是否会有意见?
3,我们知道,现在市面上的文章大概有三种方法处理解释变量,直接取对数(一般对于大于1 的变量),原始值加1后取对数(一般对于原始值负数、0较多或者小于1),直接使用原始值(估计是作者喜好吧)。我想问问有没有一个可以参考的标准来告知我们在何种情况下使用哪种方法?如有相关文献的话,请您介绍一下,谢谢!

再次表示感谢!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-10-8 09:32:12
这个问题确实没有定论,文献里大牛们三种方法都用过。

我个人的理解如下,仅供参考:

1. 使用 ln(x+1) 替代 ln(x) 实在是无奈之举,原因如你所述,x 常常是小于零(但大于 -1)或等于零的数值,此时这种处理方式可以避免转换后出现大量缺漏值的问题。但是,使用这种转换也是有条件的,那就是 x 本身的数值比较大。例如,若 x=10,则 ln(10)=2.3025851; ln(10+1)=2.3978953; 若 x=1000,则ln(1000)=6.9077553;ln(1000+1)=6.9087548。从这个例子里可以看出,当 x 取值比较小时,这种处理方式可能会带来一些偏差,但当 x 取值较大时,加 1 或加 10 其实影响甚微。最主要的特征在于,即使是 x =10 的情形,由于对数转换后并不影响变量观察值的相对大小,对于经济学研究多数进行定性判断(之关系系数符号和显著性)的研究目的而言,这种变换导致的偏差基本上可以忽略。

2. 直接用 x 进行回归分析,与使用 ln(x) 进行回归分析这两种方法,在解释结果时需要注意系数含义的差异,具体可以参见伍德里奇那本导论中的第5-6章。

3. 另一个更一般化的处理标准就是以前期大牛的文献为依据,这样比较稳妥一些,也不容易受到审稿人的攻击。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群