全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
3106 2
2021-10-11
如题,自变量为家庭某类金融资产占金融资产总额的比重,值介于0-1之间,且大量样本偏向于0。此外,由于大量样本家庭未持有该类资产,因此数据库中显示为缺漏值,我认为该情况下可以将缺漏值的样本家庭的占比视为零。

以上是前提情况,我的问题是:这个自变量若要进行对数变化以使其分布更接近正态分布的话,如何变换?

我自己的思考是,若删去大量零值,那么可以参考此贴中https://bbs.pinggu.org/thread-5050570-1-1.html 黄老师的变换方式,即将变量与(1-变量)的比值进行取对数。但如果为了不删除大量为零的样本,那么又该如何?是否有文献有类似的情况吗?

谢谢大家~
[size=18.899999618530273px]21
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2021-10-12 12:08:58
1.  这个值为什么要进行对数变化?假设推断中不需要对自变量的分布进行正态化假设
2. 应该不需要删除为0 的样本,到可以将其拆分为两个子样本 来比较一下
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-10-12 23:03:05
wdlbcj 发表于 2021-10-12 12:08
1.  这个值为什么要进行对数变化?假设推断中不需要对自变量的分布进行正态化假设
2. 应该不需要删除为0  ...
谢谢您的回复,对于第一点,是我基础不扎实了,习惯性的理解是想要通过对数消除长尾部分的异常值,但是对于您提到的对于假设推断中的要求没有特别仔细的去推敲。
对于第二点,如果将零值单独作为一个子样本回归,那么其意义不就是当这个自变量不存在时候的结果嘛?这种比较一般的意义在哪里呢?
再次感谢您的回复!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群