全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管百科 爱问频道
2149 7
2021-03-30
想问一下大家,一个变量存在很多0值,所以我参考以往研究就加1后取了对数。但是问题在于这个变量有很多值是1或2或3这样的小一点的整数,因此我怕直接给这个变量加1,会改变这个数太多。为了增加数值本身的大小,我给这个数值乘以了1000后再加1,就是ln(1000*X+1)这样处理
不知道这样的处理可以吗?会不会被审稿人质疑。请大家帮我解答一下这个问题,谢谢!!


这个图是这个变量取值的一部分情况

     变量x |      频数    占比      累计频率
------------+-----------------------------------
          0 |      1,708       13.32       13.32
          1 |        599        4.67       17.99
          2 |        392        3.06       21.05
          3 |        251        1.96       23.01
          4 |         99        0.77       23.78
          5 |        318        2.48       26.26
          6 |        241        1.88       28.14
          7 |        393        3.06       31.20
          8 |        135        1.05       32.25
          9 |         87        0.68       32.93
         10 |        226        1.76       34.70
         11 |         43        0.34       35.03
         12 |        328        2.56       37.59
         13 |        255        1.99       39.58
         14 |        134        1.04       40.62
         15 |        101        0.79       41.41
         16 |         50        0.39       41.80
         17 |         90        0.70       42.50
         18 |        126        0.98       43.48
         19 |        199        1.55       45.04
         20 |         85        0.66       45.70
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2021-3-30 10:03:32
我记得陆铭老师用的就是加1,你这么做不太好
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-3-31 12:37:28
这样不行吧,试试变成二值选择模型怎么样,就是把数值全部变成为1和不为0呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-4-3 09:45:07
是的,我也发现了这样是不太行!看了一下乘1000后,方差变大了很多,而且随意扩大量级是没有道理的。
由于我数据和研究的问题,没有选择二值模型,那样会少掉很多的信息。
谢谢你的回答,我现在换了方法去做了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-4-3 11:38:13
我感觉这样做不太行
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-4-3 16:41:06
感觉这样不行,之前好像有看到,有的文章里面会把这类值直接设成1,好像是经济研究上的一篇文章,具体文章名字不太记得了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群