全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
18418 9
2013-04-10
急问:1 聚类分析是不是可以单独做,不用非得先做因子分析再做聚类?
         2 聚类分析时,变量有什么要求,变量相关性较高的是不是不可以做聚类?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-4-10 14:56:51
1.当然可以,其实有时候可以直接聚类就直接聚类,实在没有办法了才因子分析后聚类。因为因子分析后累计贡献率不可能100%,一般有个70%到80%已经是很好很好。这就意味有30%-20%的数据信息在因子分析压缩时损失掉了,然后你基于因子得分再聚类又有一次数据损失。这样一来2次损失一叠加原始数据的失真是很大的。
2.变量的要求取决于聚类的方法。两步聚类用于连续变量、状态变量的混合数据。K-mean聚类只有用于连续型变量。系统聚类都可以。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-4-10 16:01:49
602dxz 发表于 2013-4-10 14:56
1.当然可以,其实有时候可以直接聚类就直接聚类,实在没有办法了才因子分析后聚类。因为因子分析后累计贡献 ...
那对于非连续的变量就只能用系统聚类了?几种非连续的变量即便相关系数较高 且显著也可以用系统聚类,对吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-4-10 16:23:59
可以,但是系统聚类不允许不同类型的变量混在一起。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-4-10 16:41:01
602dxz 发表于 2013-4-10 16:23
可以,但是系统聚类不允许不同类型的变量混在一起。
抓住 再问下 所谓不同类型指的是虚拟和非虚拟吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-4-10 18:26:21
不是。比如类别变量与连续变量。虚拟变量只是类别变量的一种
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群