全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
11112 2
2008-03-31
各位XDJM,我从一本书上看到用K均值法作聚类分析时,对于聚类的数目可以采用下面的方法:
为了克服输入参数值K与真实值不同的缺陷,可以采取在聚类时,输入几个K值多次聚类,最后分析每种聚类结果,选取较优的输出。选取的原则为同类内的样本之间的离差平方和应尽可能的小,而类间的离差平方和应当较大。
我论文中的要把5万个样本数据聚类,我把他们聚成5——10类,方差表如下所示,不知道那一类的聚类效果最好,麻烦高手给看看!!!不胜感激!!!!!!!
[求助]spss中k均值聚类问题
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2008-4-1 23:39:00

个人观点:聚类分析属于探测性研究,可能形成的分类结果在分析之前是未知的。但是我们可以根据理论和研究的目的,有个预想的分类数。分类数的确定应该可以算是聚类分析的难点之一,有几个方式可以帮助你确定分类数:

1、根据已有研究成果和研究的目的确定;

2、分类数应该保证在n/30~n/60之间(Lehmann);

3、对聚合系数的变化进行分析( agglomeration coefficient ),比较小的聚合系数表示同质性较强的两个小类被合并到一起, 而比较大的聚合系数或者比较大的变化则表示两个差异较大的类别被合并到一起;

4、可随即选择小样本进行聚类分析,对形成的分类树进行分析;

5、借助判别分析,对分类结果进行验证,选择验证结果较好的。

——好像有点复杂!

 

[此贴子已经被作者于2008-4-1 23:40:09编辑过]

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-4-1 23:46:00

如果满意,别忘了帮我美言几句!奖点金币啥的!

——论坛公告转载:每解决其他会员1个问题,奖励100论坛币,发站内短信给"admin888"申请,指出链接。

[此贴子已经被作者于2008-4-1 23:48:51编辑过]

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群