H-K聚类 - 经管之家

1783

收藏 2016-08-11

最近在学习聚类这一块，有一个问题关于H-K（层次聚类-K均值）聚类的问题向大家请教。书上说由于K均值聚类的中心是随机选取的，因此需要多次迭代，而H-K聚类可以先用层次聚类确定聚类中心和数量，再用K-均值聚类。那么请问这两种方法是怎么结合到一起的呢，层次聚类是怎么确定聚类中心的，R代码又是怎么实现的

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

bbslover

2016-8-13 04:52:55

有很多package做这两种聚类分析。如果你要学习内部操作，首先你要懂得算法原理。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

1528428009

2016-8-13 16:51:43

bbslover 发表于 2016-8-13 04:52
有很多package做这两种聚类分析。如果你要学习内部操作，首先你要懂得算法原理。

我知道用哪些包可以实现，我也知道操作，如果您知道答案请正面回答问题

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

bbslover

2016-8-13 23:48:39

正面回答，哈哈~

尝试回答一下：
而H-K聚类可以（1）先用层次聚类确定聚类中心和数量，（2）再用K-均值聚类。

你的问题的核心是：如何确定需要多少个cluster（这也是所有clustering算法最需要解决的问题，但是没有最好的办法）？而（1）说用hclust()帮助你得到所谓的cluster的数量，比如是3。然后你可以用3作为k-mean的输入[kmeans(x, centers = 3）]，得到最终的聚类结果。

我想大体就是这样。

其实有很多办法来确定最优的cluster数目，但不能说哪个是最好的，都与你数据本身有关。

Good luck.

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群