全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
4938 3
2011-03-10
k-means聚类,你懂的。

这个方法要求在聚类开始前明确分为几类,然后自己指定初始聚类中心或者让spss系统自己去随机选择初始中心。有很多资料提出聚类结果对初始聚类中心特别敏感,就是说,我们很有可能得到的是一个局部最优解而非全局最优解。

关于初始类中心到底应该如何选择,或是不用选择让spss自己去完成,这有定论么?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2011-3-10 18:09:43
自己先顶一个,期待关注。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-3-11 22:05:49
根据和初始聚类中心的距离远近,把所有点分成k类。再把这k类的中心(均值)作为新的中心(原来的中心就没用了),重新按照距离分类。
如此叠代下去,直到达到停止叠代的要求(比如,各类最后变化不大了,或者叠代次数太多了)。显然,初始聚类中心的选择并不必太认真,它们很可能最后还会分到同一类中。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-3-12 00:27:26
这一段话是spss自己的教材说的,他采用 的是迭代的方法,可是,迭代来迭代去还是局部的解。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群