全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
3231 2
2015-11-03
对原数据(共有299,330个个案,16个变量)做了主成分分析,得到了每个个案在各个主成分(获得了4个主成分)下的得分,以此为据进行了K-mean'聚类分析,得到了5个类。

现在的状况是只能用这4个主成分的具体状况来描述每个类的状况,而我的数据要求最好能用原来的那16个变量的状况加以描述,请问这个如何实现?

是不是存在一种比较简单的数理方法,当我把同一类个案放在一起时,可以由他们各自的16个变量取值来得到反映这个类整体的这16个变量取值的指标,如同前述聚类操作最后得到的“聚类中心”?

在数理统计方面基础比较薄弱,望各位不吝赐教。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-11-4 00:24:36
我觉得主成分能够做的前提是变量间存在比较高的相关性,这样才能提取主成分,或者你也可以理解为是一种降维的处理。而如果你要用16个变量来描述,那么这个前提是这16个变量间的相关度不高,否则容易共线性(当然我是假设你用回归的思想做)。那么这么一来这两个就是相互矛盾的。所以我觉得先要判断是或否能做主成分 如果能做的话那意味着不适合16个变量来做分析。个人意见哈!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-7-21 18:09:57
请问楼主最后是如何解决的呢?很想学习一下。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群