全部版块 我的主页
论坛 站务区 十一区 新手入门区
1712 1
2023-11-23

主成分分析(PCA):

原理:PCA通过将多个指标转换为少数几个主成分,并根据每个主成分的解释方差比例来确定权重。它是一种线性降维方法,旨在找到解释原始数据方差最多的新变量或维度。

优势:PCA能够减少数据的维度,提取出主要的特征,并避免过拟合问题。它适用于处理多个指标之间的关系,更侧重于方差的解释。

适用性:如果你更关注的是指标间的方差及其对总体方差的解释,PCA可能是一个合适的选择。它常用于数据降维、可视化以及多元统计分析等领域。

主成分分析法的主要目的是找到能够最大程度解释总体变异的少数几个主成分。这种方法通过将原始指标转换为新的正交坐标系,将原始指标的方差最大化的同时,最小化新坐标系中的指标个数。因此,在处理非线性关系和复杂的高维数据时,主成分分析法可能更有效。

代码:factor 原变量1 原变量2 原变量3, pcf

运行Stata18后会自动给出因子,比如给出Factor1,Factor2。原变量为横坐标,Factor1,Factor2为纵坐标,交点就是权重。比如运行结果:

-------------------------------------------------

        Variable |  Factor1   Factor2 |   Uniqueness

    -------------+--------------------+--------------

           rdpii |   0.9790   -0.0225 |      0.0411

            rdei |   0.9534    0.1247 |      0.0755

             ppi |   0.7484    0.5828 |      0.1002

             pgi |   0.9572   -0.0820 |      0.0770

            npoi |   0.8047   -0.3545 |      0.2267

            rdai |   0.8474   -0.4443 |      0.0845

             tmi |   0.6149    0.7310 |      0.0875

             iii |   0.6820   -0.3553 |      0.4087


    -------------------------------------------------

计算这两个因子的综合指数值的公式:

Factor1 综合指数值 = 0.9790 * rdpii + 0.9534 * rdei + 0.7484 * ppi + 0.9572 * pgi + 0.8047 * npoi + 0.8474 * rdai + 0.6149 * tmi + 0.6820 * iii

Factor2 综合指数值 = -0.0225 * rdpii + 0.1247 * rdei + 0.5828 * ppi - 0.0820 * pgi - 0.3545 * npoi - 0.4443 * rdai + 0.7310 * tmi - 0.3553 * iii

综上所述,现行数据情况,因子分析法可能更适合确定权重以处理共线性问题。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2023-11-30 10:33:23
感谢分享
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群