我是理工科的小辣鸡一枚,因为研究生的方向和本科接触的东西有跨度,开始改做空间关联性分析。一来没基础,二来没经验,总是遇到问题。这不,如标题,我遇到了需要对0取对数的情况,瞬间傻眼了。我把具体的情况写一下吧。
问题1:最近在研究2001-2020年固废行业技术专利的空间关联性,为了验证我国固废利用行业创新产出的区域分布不均,打算利用下式计算Theil熵指数:
式中,x_i指的是i省份的专利申请量。但有相当一些省份固废行业起步晚,甚至在2010年专利申请量还是0,对应Theil熵指数就是负无穷。这样的省份不在少数,而且跨越的年份也太多了,实在不能忽略。于是很无助。
问题2:同样是针对部分省份专利申请量为0的情况,我本来打算构建VAR模型,在这之前要进行对数处理来消除异方差影响。取对数的时候看着满屏的ln0,再次傻眼了。
导师说类似情况可以用某个数来替代0值,但是我从网上没找到具体的描述;还有大佬说把取对数的值由0换成1,这样最后还是0,但是原本也有很多省份专利申请量正好是1,这样的话申请量是0的和申请量是1的省份取对数之后完全一样,感觉也会影响效果。
很迷惑很迷惑。遂诚心求教,跪了跪了orz