[Method]:这里需要决定是对标准化数据还是中心化数据执行 PCA。Standardized data - 推荐,也称为相关矩阵上的主成分分析,适用于变量单位不相同的情况;Centered data - 对中心化数据执行主成分分析,是适用于单位相同的变量的情况,又称为协方差矩阵主成分分析(PCA on the covariance matrix)。但是这较少使用;
[Method for selecting principal components]:选择主成分的过程就是确定降维数据集在执行 PCA 后中将具有多少个「维度」的过程;
03 主成分回归分析(PCR, Principal Component Regression)
PCR 是多元线性回归和主成分分析的结合。主要用于解决自变量之间存在高度相关的情况。英文注释参考:
Principal component regression (PCR) is a combination of multiple linear regression and principal component analysis. One of the primary goals of Principal Component Analysis is to reduce the number of predictors for a future analysis, which also reduces the number of degrees of freedom in the model.
变量贡献矩阵(Comtribution matrix of variables):变量的贡献矩阵表示哪些变量对主成分的计算做出了「贡献」。每一行代表一个变量,每一列代表一个主成分。
变量与主成分之间的相关矩阵(Correlation matrix between variables and Principal Components):如果你对标准化(居中和缩放)数据运行 PCA,那么这个矩阵与载荷矩阵相同。但是,如果你对中心化数据运行 PCA,那么载荷矩阵就是变量与特征向量的协方差。在这种情况下,你可能希望查看相关矩阵,以便更容易地解释载荷的大小。
实例贡献矩阵(Contribution matrix of cases):与变量的贡献矩阵类似,实例的贡献矩阵表示相对于其他行,哪些行对主成分有贡献。每一行代表一种实例(原始数据表中的行),每一列代表一个主成分。注意,只有在对应的方法勾选后,该矩阵才会在表中显示。
变量之间的相关 or 协方差矩阵(Correlation/Covariance matrix between variables):变量之间的相关(或协方差)矩阵,就是数据输入列的相关(或协方差)矩阵。如果数据已做了标准化(居中和缩放),那它与相关矩阵是相同的。