R语言的两种主成分分析

bbjjlovely

16253

收藏 2015-04-24

同一样本数据，2种不同代码得出的主成分得分系数为什么不一样？下面的完整代码，求问，很困惑，不知道哪一种是对的？

法一：

shuju<-read.csv(file="shuju.csv",header=TRUE,sep=",")

library(psych)

library(GPArotation)

fa.parallel(shuju[,-1],fa="pc",n.iter=100,show.legend=FALSE)

pc<-principal(shuju[,-1],nfactors=4,score=T)

RC1 RC2 RC3 RC4 h2 u2

Open 0.95 0.11 0.21 0.16 0.98 0.0220

High 0.95 0.15 0.20 0.18 0.99 0.0074

Low 0.94 0.17 0.22 0.13 0.99 0.0147

Close 0.94 0.22 0.21 0.14 0.99 0.0094

Volume 0.67 0.26 0.14 0.59 0.88 0.1215

Chengjiaoe 0.72 0.27 0.12 0.56 0.91 0.0851

MA5 0.95 0.00 0.20 0.16 0.98 0.0228

AR26 0.14 0.23 0.92 0.17 0.96 0.0448

BR26 0.33 0.23 0.89 0.15 0.97 0.0329

BIAS12 0.19 0.89 0.30 0.16 0.93 0.0668

OBV 0.88 0.16 -0.02 0.29 0.88 0.1214

PSY 0.36 0.16 0.38 0.73 0.83 0.1656

K 0.19 0.79 0.29 0.29 0.83 0.1697

WR -0.10 -0.93 -0.0 0.02 0.88 0.1231

法二：

shuju.pr<-princomp(shuju[,-1],cor=TRUE)

summary(shuju.pr,loadings=TRUE)

Loadings:

Comp.1 Comp.2 Comp.3 Comp.4

Open -0.312 0.199 0.182

High -0.319 0.178 0.158

Low -0.316 0.165 0.233

Close -0.320 0.144 0.213

Volume -0.293 -0.411

Chengjiaoe -0.302 -0.365

MA5 -0.301 0.258 0.162

AR26 -0.186 -0.332 0.568 0.126

BR26 -0.230 -0.254 0.520 0.206

BIAS12 -0.203 -0.466 -0.239

OBV -0.288 0.209 -0.181

PSY -0.241 0.210 -0.628

K -0.207 -0.422 -0.186

WR 0.134 0.435 0.466 -0.209

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

katymeala

2015-4-25 13:39:45

principaL做主成分默认是方差极大旋转，所以得到的PC1 PC2 并不是按照方差贡献率排序的（也就是不是让PC1解释最多方差，PC2其次…这种，而是让PC间尽量不相交）想要得到真正的PC成分，rotate改成‘none’ 当然具体情况再看具体怎么选
而且 principal输出的RC1 RC2 RC3 是主成分与原始变量的相关系数，h2是联合解释率，u2是1-h2，所以你从princal的结果是看不出PC到底是什么
既然都看不出是什么，为什么你断定两种方法结果不同
-----------------------------------------------
用princomp输出的结果跟前者不一样，SS loading输出的把原始变量变成PC需要的系数，而不是成分

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

bbjjlovely

2015-4-25 19:15:32

katymeala 发表于 2015-4-25 13:39
principaL做主成分默认是方差极大旋转，所以得到的PC1 PC2 并不是按照方差贡献率排序的（也就是不是让PC1解 ...

谢谢你，是我理解的不透。
方法一经过 new_shuju<-pc$scores 得到的是最终需要的新数据吗？不太明白主成分得分这个概念

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

katymeala

2015-4-25 19:52:31

bbjjlovely 发表于 2015-4-25 19:15
谢谢你，是我理解的不透。
方法一经过 new_shuju

是的
主成分分析是把几个变量整成一个变量，例如一个n*m的矩阵(n个人，每个人m个指标)，转换成n*l的数据矩阵（l<m） l就是主成分的个数是m个变量的线性组合的结果所以pc$scores得到的主成分得分就是这个n*l的矩阵

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

bbjjlovely

2015-4-25 20:18:57

katymeala 发表于 2015-4-25 19:52
是的
主成分分析是把几个变量整成一个变量，例如一个n*m的矩阵(n个人，每个人m个指标)，转换成n*l的数据 ...

还有个问题哦，最后的方程这样对吧：
y1=-0.312x1-0.319x2...+0.314x14
y4=0.182x1 ... -0.209x14
这里面的x1 x2是什么数据？
这个系数，也就是法2里的loadings,叫主成分载荷吗？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

katymeala

2015-4-25 20:25:57

bbjjlovely 发表于 2015-4-25 20:18
还有个问题哦，最后的方程这样对吧：
y1=-0.312x1-0.319x2...+0.314x14
y4=0.182x1 ... -0 ...

x1-x14就是14个指标，就是前面说的n*m里的m，就是原始数据
系数loading跟法1的$weights一样

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

bbjjlovely

2015-4-25 20:48:07

katymeala 发表于 2015-4-25 20:25
x1-x14就是14个指标，就是前面说的n*m里的m，就是原始数据
系数loading跟法1的$weights一样

方法2应该是经过标准化得到的系数，那x1 x2是否是原始数据标准化后的数据？
因为我把法1 rotate="none",得到的
            PC1 PC2 PC3 PC4    h2 u2
Open       0.93  0.30  0.00 -0.14 0.98 0.0220
High       0.95  0.27 -0.03 -0.13 0.99 0.0074
Low       0.94  0.25 -0.03 -0.18 0.99 0.0147
Close    0.95  0.22 -0.06 -0.17 0.99 0.0094
Volume    0.87  0.05 -0.07  0.32 0.88 0.1215
Chengjiaoe  0.90  0.08 -0.11  0.29 0.91 0.0851
MA5       0.90  0.39  0.05 -0.13 0.98 0.0228
AR26       0.56 -0.50  0.62 -0.10 0.96 0.0448
BR26       0.69 -0.38  0.57 -0.16 0.97 0.0329
BIAS12    0.61 -0.70 -0.26 -0.07 0.93 0.0668
OBV       0.86  0.31 -0.20  0.04 0.88 0.1214
PSY       0.72 -0.13  0.23  0.50 0.83 0.1656
K          0.62 -0.64 -0.20  0.07 0.83 0.1697
WR       -0.40  0.66  0.51  0.17 0.88 0.1231
这里的PC1 PC2...是不是相当于法2的loadings?

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

katymeala

2015-4-25 20:52:30

bbjjlovely 发表于 2015-4-25 20:48
方法2应该是经过标准化得到的系数，那x1 x2是否是原始数据标准化后的数据？
因为我把法1 rotate="none", ...

无论哪种方法，都是（列）标准化以后做的，函数内部自己会处理，乘系数那个数就是标准化以后的数
PC1 PC2是主成分跟原始数据的相关系数不是主成分得分想看法1的loading，用$weights

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

bbjjlovely

2015-4-25 20:58:27

katymeala 发表于 2015-4-25 20:52
无论哪种方法，都是（列）标准化以后做的，函数内部自己会处理，乘系数那个数就是标准化以后的数
PC1 PC ...

再次表示感谢

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

bbjjlovely

2015-4-25 20:58:27

katymeala 发表于 2015-4-25 20:52
无论哪种方法，都是（列）标准化以后做的，函数内部自己会处理，乘系数那个数就是标准化以后的数
PC1 PC ...

再次表示感谢

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

bbjjlovely

2015-4-25 21:46:42

katymeala 发表于 2015-4-25 20:52
无论哪种方法，都是（列）标准化以后做的，函数内部自己会处理，乘系数那个数就是标准化以后的数
PC1 PC ...

抱歉，又来打扰，我经过了round(unclass(pc$weights),4)，得到如下，和法2的loadings还是有很大差别，是为什么？
            PC1    PC2    PC3    PC4
Open       0.1047  0.1318  -0.0022  -0.2304
High       0.1068  0.1182  -0.0269  -0.2001
Low       0.1059  0.1094  -0.0254  -0.2950
Close    0.1073  0.0956  -0.0539 -0.2701
Volume    0.0983  0.0237  -0.0622  0.5195
Chengjiaoe  0.1014  0.0354 -0.0897  0.4619
MA5       0.1010  0.1710  0.0390  -0.2044
AR26       0.0624 -0.2201  0.5193 -0.1594
BR26       0.0771 -0.1687  0.4751 -0.2603
BIAS12    0.0681 -0.3089 -0.2186  -0.1079
OBV       0.0966  0.1383  -0.1653  0.0582
PSY       0.0808 -0.0588 0.1919 0.7945
K          0.0693 -0.2796 -0.1696  0.1135
WR       -0.0448  0.2886  0.4263  0.2650

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

dragonp

2016-2-29 00:33:03

你这个是r in action 里面的吧，这书里面说的round(unclass(pc$weights),4)是获取主成分得分系数，但是我看多元统计书里面讲的主成分得分系数是特征值对应的正交特征向量，可以用eigen()来查。这里的weights我也不知道是什么，请教！ F=AX (A应该是单位特征向量才对啊)。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

aiwai123

2016-4-8 10:29:35

多谢，现在总算明白了

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

Chengweing

2016-4-30 17:03:29

aiwai123 发表于 2016-4-8 10:29
多谢，现在总算明白了

我使用principal函数时没发现问题，但是经楼主反映，就有疑问了，查了下帮助文档，解释如下：“Basically it is just doing a principal components analysis (PCA) for n principal components of either a correlation or covariance matrix.... Unlike princomp, this returns a subset of just the best nfactors.”就是说PC1,PC2....是给出的N个主成分因子的较优的一个子集而非全部。不理解，前面说的PC值不是主成分，求解释？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

fx911

2017-9-24 19:28:26

principal，是不是可以理解成因子分析，主成分分析用princomp函数。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

spsssas

2019-2-16 18:10:37

fx911 发表于 2017-9-24 19:28
principal，是不是可以理解成因子分析，主成分分析用princomp函数。

不可以，因子分析函数是fa()

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

fx911

2019-3-27 10:38:18

spsssas 发表于 2019-2-16 18:10
不可以，因子分析函数是fa()

谢谢，新手尝试

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

guifeichao

2019-12-12 17:17:22

用SPSS做的因子分析（使用主成分方法）得到的结果和principal函数得到的结果一样，主成分得分也是一样。那么到底是应该用principal的主成分得分还是princomp得到的主成分得分呀？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群