以log(x+1)取对数出现的问题

peyzf

15428

收藏 2013-02-13

原始数据为x,但x有大量的零值。

要将x转化为对数形式，即建立新变量y.

采用y=log(x+1)的形式是否合理？这样可以避免将大量的零值删除。其对于1的选取有何讲究，是应该取0.1，0.01还是1？

但其可能改变统计分布，如数据中报告的均为级别（x,y,z,t组）变量的均值，为何在rd中，样本组y的均值小于样本组x,而在lrd中，样本组y的均值大于样本组x？

变量

Lrd

273.3

0.501

181.3

0.559

204.1

0.508

217.9

0.424

问题何在？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

lixp1020

2013-2-13 07:57:20

取y=log(x+1)是否合理具体问题具体分析。
第二个问题结果很正常，如果第二组数据的方差比较小。举个例子
(1+3)/2>(2+1.9)/2 但是 (log(1+1)+log(3+1))/2<(log(2+1)+log(1.9+1))/2

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

peyzf

2013-2-13 08:54:20

那么，在存在大量零值，且需要取对数时，通常如何处理？

在哪些情况下，取log(x+1)是合理的？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

sungmoo

2013-2-13 09:41:20

two part model ?

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

peyzf

2013-2-13 15:07:29

谢谢。sungmoo 是建议使用0-1变量？然后再看大于0零的观测值的决定因素？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

微风ing6

2015-10-22 23:36:52

所以，这种情况怎么办呢？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群