这篇论文中的处理方式是将哑变量合并,这我也没有看懂是什么意思。
赵剑治, 陆铭. 关系对农村收入差距的贡献及其地区差异——一项基于回归的分解分析[J]. 经济学(季刊), 2010, 9(1):363-390.
“由于我们使用的分解方法涉及许多轮的运算, 每增加一个变量, WIDER
开发的程序的运算量将呈几何级数增长 , 当变量超过 10 个时 , 由于运算量过
大 , 经常无法得到结果 。因此 , 为简化计算, 我们在最后分解时将根据回归
方程对含义相近的变量进行合并 :第一是将所有村庄的哑变量合并;第二是
将家庭特征中的家庭规模和人均劳动力人数合并;第三是将劳动力人均教育
年份和它的平方项合并作为教育因素 。这样做 , 能在不影响整个分解结果的
前提下得到主要变量对于收入差距的贡献”