主成分分析的功能与意义
将众多初始变量整合成少数几个相互无关的主成分变量,而这些新的变量尽可能的包含了初始变量的全部信息,然后用这些新的变量来代替以前的变量进行分析。
相关数据
近年过年经济主要指标:全国人口 农林牧渔业总产值 工业总产值 国内生产总值 全社会投资总额 货物周转量 社会消费品零售总额 进出口贸易总额 原煤 发电量 原油 钢 汽车 布 糖 粮食 棉花 油料,分析主成分与指标间的表达式
分析过程
分析-降维-因子分析
描述
结果分析
(1)系数相关矩阵
各个变量之间都具有一定的相关关系而且有些相关系数还比较大,接近1,所以本例很适合使用主成分分析。
(2)各成分的方差贡献率和累计贡献率
只有前两个特征值大于1,所以只选择前两个主成分。第一主成分的方差贡献率是80.233%,前两个主成分的方差占所有主成分方差的88.118%。由此可见,前两个主成分足够替代原来的变量。
(3)主成分系数矩阵
各个主成分在各个变量上的载荷,从而可以得出各主成分的表达式,表达式中各个变量已经不是原始变量而是标准变量。具体表达式略。在第一主成分中,除两市以外的变量的系数比较大,可以看成是反映那些变量方面的综合指标,在第二主成分中,变量粮食的系数比较大,可以看做是反映粮食的综合指标。但是主成分分析只是一种矩阵变换,所以各个主成分并不一定具有实际意义。
