全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件
7011 4
2018-04-24

看了不少资料,对这俩的基本原理没问题。
主成分分析是PC=wX,主成分PC是原始变量X的线性组合;
因子分析是 X=w
FA, 因子FA线性组合得到原始变量X。

两者都可用于降维。

看国内不少文章,越来越迷糊,所以来找大家讨论下,谢谢!

文章:基于因子与聚类分析的西部省区经济发展比较研究_刘玮

该文是采用多个指标分析各省经济综合发展水平(即做综合评价)。先用因子分析提取出两个因子(文章称为主成分,是否恰当?)、并计算综合成分,排名;然后用俩因子又做了聚类,划分出多个分组。

我的疑问

1,在基于多个指标做综合评价时,也有研究用PCA来提取多个主成分,然后命名,还计算综合得分;而这篇文章是因子分析。 到底哪个合适?还是都可以?
2.基于多个指标做聚类,PCA和FA都可以提取出少数维度(降维),那到底采用PCA-聚类,还是FA-聚类?

多谢指教!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-4-24 14:04:40
其实都可以的 因为两者都是降维的 而且很多因子分析的因子使用主成分法提取的
一般而言如果后续做回归会考虑主成分
如果后续是聚类一般因子分析会多点(但主成分仅用来综合变量的话也可以)
排名的话一般会考虑因子得分多点
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-4-24 15:03:18
胖胖小龟宝 发表于 2018-4-24 14:04
其实都可以的 因为两者都是降维的 而且很多因子分析的因子使用主成分法提取的
一般而言如果后续做回归会考 ...
谢谢你的回复。 但是还有些问题

PCA提取的主成分是综合变量,目的是最大化的区分样本(基于方差),基于这样的主成分,进行聚类,可以有效把样本划分不同簇; 但你说的“后续是聚类一般因子分析多点”,那本质上是,基于各个变量的潜在变量(即因子)进行聚类,似乎也是可以理解的。

我看有文献,采用PCA,也基于各个主成分得分,乘以方法贡献率,计算出综合得分,用来排名。 不知道这样合适不?

还有,有文献,采用PCA,提取出主成分,然后旋转,把主成分命名,这样对吗? 感觉这么做跟因子分析没区别了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-4-24 15:06:55
Dream3601 发表于 2018-4-24 15:03
谢谢你的回复。 但是还有些问题

PCA提取的主成分是综合变量,目的是最大化的区分样本(基于方差),基 ...
采用PCA,也基于各个主成分得分,乘以方法贡献率,计算出综合得分,用来排名——这种做法有的。采用PCA,提取出主成分,然后旋转,把主成分命名——这基本就是因子分析了,旋转后让方差更大便于区别和命名。
特别是当用SPSS做的时候,两者其实就差旋转这一步了,但是对于做的人自己要清楚这其实是两种方法。严格的来说主成分和因子在前提假设,表达式,应用领域都有区别,但实际应用中,很多时候都被忽视了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-4-24 16:27:13
胖胖小龟宝 发表于 2018-4-24 15:06
采用PCA,也基于各个主成分得分,乘以方法贡献率,计算出综合得分,用来排名——这种做法有的。采用PCA, ...
是的,我用过SPSS做PCA和FA,我之前的理解一直是:两者的差别就差旋转了。

但是,在R语言psych包里,principal 函数也提供了旋转参数,而还有一个factanal是用来做FA的。 这就使的更加迷糊了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群