分解的方法操作起来比较复杂,但总结起来是两个步骤:
第一个步骤:基于回归分析的分解
首先建立方程Y=a+Xb+c,其中a是常数项,b是解释变量的系数,c是误差(方程的建立因人而异,这个方程是万的观点,之前还有Morduch(2002),他把常数项去掉了,其实这个没什么大的差别)
回归之后,我们可以计算得到Y1=a+Xb,Y2=Xb,
那么误差项对不平等的贡献就为:CO(c)=I(Y)-I(Y1),常数项为CO(a)=I(Y1)-I(Y2),其他解释变量就为CO(X)=I(Y2),其中I指标的选取可以根据你的意愿,可以选择基尼系数、赛尔指数等
最后就可以得到三者的贡献率分别为CO(a)/I(Y),CO(c)/I(Y),CO(X)/I(Y)
第二步:计算shapley值,这个就比较简单,用stata
先安装rego这个命令
. net from
http://www.uni-leipzig.de/~rego/
. net install rego
安装完毕之后就可以用这个命令了,可以参考
www.uni-leipzig.de/~rego
用rego回归Y=a+Xb+c,就可以得到各个被解释变量的Shapley值了,具体可以参考《Stata module for decomposing goodness of fit according to Shapley and Owen values》(在google里直接搜索就可以)
然后再将CO(X)/I(Y)乘以各个变量的Shapley值,就可以得到各个被解释变量的贡献度
通过上述方法就可以做出来很多漂亮的论文,记得给我加威望
我之前主要是搞这个的,奈何搞了一篇很好的论文,投了几个杂志都不要,灰心了,现在转行搞计算了,就将这个不是秘密的秘密告诉你吧,希望你能搞出好文章来