注:
H(i) represents the entropy of issue iamong all the 310 contractors, while H(i,C) represents the entropyof issue i among all the certified contractors.
其中i的范围是从[1,113],C可以看成一个分类类别(认证、没有认证)。
还有不清楚的可以查看文献:Liao, P.-C., Xia, N.-N., Wu, C.-L., Zhang, X.-L., & Yeh, J.-L. (2017). Communicating the corporate social responsibility (CSR) of international contractors: Content analysis of CSR reporting. Journal of Cleaner Production, 156, 327–336.
[size=8.000000pt]
我在一篇论文中看见一个关于信息增益的计算公式(如上图),发现该计算方法与网上或者书本上介绍的正常信息增益计算公式有一些区别,因为本人不是
数据挖掘方向专业的,只是在本专业相关论文中看见该公式,并且想要弄明白该文章中信息增益公式为什么可以这样写。请问有哪位高人之前见过这种公式或者能解释清楚该公式吗?