主成分分析(PCA):
原理:PCA通过将多个指标转换为少数几个主成分,并根据每个主成分的解释方差比例来确定权重。它是一种线性降维方法,旨在找到解释原始数据方差最多的新变量或维度。
优势:PCA能够减少数据的维度,提取出主要的特征,并避免过拟合问题。它适用于处理多个指标之间的关系,更侧重于方差的解释。
适用性:如果你更关注的是指标间的方差及其对总体方差的解释,PCA可能是一个合适的选择。它常用于数据降维、可视化以及多元统计分析等领域。
主成分分析法的主要目的是找到能够最大程度解释总体变异的少数几个主成分。这种方法通过将原始指标转换为新的正交坐标系,将原始指标的方差最大化的同时,最小化新坐标系中的指标个数。因此,在处理非线性关系和复杂的高维数据时,主成分分析法可能更有效。
代码:factor 原变量1 原变量2 原变量3, pcf
运行Stata18后会自动给出因子,比如给出Factor1,Factor2。原变量为横坐标,Factor1,Factor2为纵坐标,交点就是权重。比如运行结果:
-------------------------------------------------
        Variable |  Factor1   Factor2 |   Uniqueness
    -------------+--------------------+--------------
           rdpii |   0.9790   -0.0225 |      0.0411 
            rdei |   0.9534    0.1247 |      0.0755 
             ppi |   0.7484    0.5828 |      0.1002 
             pgi |   0.9572   -0.0820 |      0.0770 
            npoi |   0.8047   -0.3545 |      0.2267 
            rdai |   0.8474   -0.4443 |      0.0845 
             tmi |   0.6149    0.7310 |      0.0875 
             iii |   0.6820   -0.3553 |      0.4087 
    -------------------------------------------------
计算这两个因子的综合指数值的公式:
Factor1 综合指数值 = 0.9790 * rdpii + 0.9534 * rdei + 0.7484 * ppi + 0.9572 * pgi + 0.8047 * npoi + 0.8474 * rdai + 0.6149 * tmi + 0.6820 * iii
Factor2 综合指数值 = -0.0225 * rdpii + 0.1247 * rdei + 0.5828 * ppi - 0.0820 * pgi - 0.3545 * npoi - 0.4443 * rdai + 0.7310 * tmi - 0.3553 * iii
综上所述,现行数据情况,因子分析法可能更适合确定权重以处理共线性问题。