全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 统计软件培训班VIP答疑区
5118 2
2013-02-13

对存在大量零值的变量取对数

原始数据为x,x有大量的零值。

要将x转化为对数形式,即建立新变量y.

采用y=log(x+1)的形式是否合理?

但其可能改变统计分布,如数据中报告的均为级别(x,y,z,t组)变量的均值,为何在rd中,样本组y的均值小于样本组x,而在lrd中,样本组y的均值大于样本组x

变量

rd

Lrd

X

273.3

0.501

Y

181.3

0.559

Z

204.1

0.508

T

217.9

0.424


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-2-14 19:59:44
我不太明白你的问题,尤其是你列的那张表。请把所有符号的含义说清楚。
尤其是,你的表述中出现了两个x 和两个y。他们的含义相同吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-2-15 02:35:57
抱歉没有表达清楚。
变量为rd和 lrd    由于 rd中存在大量的零值,在取对数时,我采用了 lrd=log(rd+1)的形式。

XYZT代表不同的组别,每个组别内有许多样本,表格中的数值为各组别样本的均值。
我的问题是,对于变量 rd ,组 X的均值要大于 Y,但对于变量 lrd,组 X的均值要小于 Y。因此,我质疑
采用了 lrd=log(rd+1)形式的合理性。

谢谢。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群