全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
9391 18
2012-12-14
我先用10个原始变量得出3个主成分,现在要做聚类分析,请问到底要用10个原始变量聚类,还是用3个主成分做变量,还是用最后的综合得分做变量呀,请大家帮助我
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-12-14 13:46:46
当然用因子得分咯,你做因子分析不就是因为变量太多且变量间存在相关性所以想压缩成2、3个便于处理与说明么
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-12-14 14:01:51
602dxz 发表于 2012-12-14 13:46
当然用因子得分咯,你做因子分析不就是因为变量太多且变量间存在相关性所以想压缩成2、3个便于处理与说明么
就是用三个因子的得分是吗,那最后计算的因子综合得分呢,这个要用吗
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-12-14 16:50:37
不是很明白你的综合变量的意思,如果综合变量是基于三个因子得出来的那就不要了,不然就有重复了。另外,对因子得分进行聚类的话建议用k-mean聚类。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-12-14 17:22:17
602dxz 发表于 2012-12-14 16:50
不是很明白你的综合变量的意思,如果综合变量是基于三个因子得出来的那就不要了,不然就有重复了。另外,对 ...
对的,综合变量就是用三个因子算出来的综合得分,所以我才会问到底用三个因子当聚类分析的输入变量好,还是就用一个综合变量当聚类分析的输入变量好,但是K均值的聚类不是要自己主观的制定聚类的个数了吗,这样合理吗
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-12-14 17:36:49
因子得分一般用k-mean和系统聚类,但是因子分析+k均值已经是很标准的一套方法了,我在实践中(企业)没有看到过用系统聚类来处理因子得分的。至于聚几类这个问题没有标准答案的,需要先验理论支持。一般在定量分析前大概心里有数聚多少个类别。当然你也可以看统计量(比如用判别分析来检验归类的准确率,以及对类别间以及类别内做F检验),如果你样本量小于500个,那么K-mean聚类的最小类别百分尽量比不少于5%,然后每个类别都有明显的差异(可以用语言很简练地说明其区别),判别分析的准备率至少90%以上。当然如果你纯粹是探索性的研究,做前心里根本不知道该聚几类,那你可以先系统聚类作为参考,最后还是还用k-meam聚类来进行“精细化”操作的。聚类分析中聚几类一直是一个定性分析为主,定量辅助的问题。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群