全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
42182 9
2015-12-11
在用SPSS进行个案聚类分析时是否需要对变量进行标准化?还是直接采用原始数据惊喜聚类?两者出来的结果好像不一致,那么采用哪个为准呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-12-11 18:06:36
需要标准化,因为原始数据中的极端异常值会严重影响结果。祝好运~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-12-11 18:35:54
亲,不需要标准化的。聚类主要是看观察值的聚类。如果想用标准化数据来做,可以在SPSS聚类分析中选择0-1标准化的值来处理,而不需要事先在原始数据中标准化。此外,如果数据中存在极端值,标准化之后的数据依然存在极端值,因此,极端值的处理不是通过标准化而是通过删除处理的。另外,聚类分析对原始数据的原始值非常重视,即便是极端值,它们本身也是“特殊一类”,所以,对极端值的处理要慎重。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-12-13 14:40:45
谢谢上面两位的回答。  我仔细看看了书,发现,在用K-means快速聚类时,是不需要对变量进行标准化的。但是做层次聚类时,特别是R型层次聚类时,如果各变量存在有量纲的差异化,数据存在数量级的差异,还是需要做标准化处理的,否则出来的结果就不一致的。做R型层次聚类时,还需要各变量之间有较强的相关关系。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-2-17 18:35:58
hdyak002 发表于 2015-12-13 14:40
谢谢上面两位的回答。  我仔细看看了书,发现,在用K-means快速聚类时,是不需要对变量进行标准化的。但是做 ...
请问你看的是什么书啊,我要用密度聚类,不知道是不是需要标准化?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-4-5 15:48:24
hdyak002 发表于 2015-12-13 14:40
谢谢上面两位的回答。  我仔细看看了书,发现,在用K-means快速聚类时,是不需要对变量进行标准化的。但是做 ...
你好,请问什么书上写有关于聚类分析需不需要对数据进行标准化的内容?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群