全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1725 3
2016-08-11
最近在学习聚类这一块,有一个问题关于H-K(层次聚类-K均值)聚类的问题向大家请教。书上说由于K均值聚类的中心是随机选取的,因此需要多次迭代,而H-K聚类可以先用层次聚类确定聚类中心和数量,再用K-均值聚类。那么请问这两种方法是怎么结合到一起的呢,层次聚类是怎么确定聚类中心的,R代码又是怎么实现的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-8-13 04:52:55
有很多package做这两种聚类分析。如果你要学习内部操作,首先你要懂得算法原理。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-8-13 16:51:43
bbslover 发表于 2016-8-13 04:52
有很多package做这两种聚类分析。如果你要学习内部操作,首先你要懂得算法原理。
我知道用哪些包可以实现,我也知道操作,如果您知道答案请正面回答问题
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-8-13 23:48:39
正面回答,哈哈~

尝试回答一下:
而H-K聚类可以(1)先用层次聚类确定聚类中心和数量,(2)再用K-均值聚类。

你的问题的核心是:如何确定需要多少个cluster(这也是所有clustering算法最需要解决的问题,但是没有最好的办法)?而(1)说用hclust()帮助你得到所谓的cluster的数量,比如是3。然后你可以用3作为k-mean的输入[kmeans(x, centers = 3)],得到最终的聚类结果。

我想大体就是这样。

其实有很多办法来确定最优的cluster数目,但不能说哪个是最好的,都与你数据本身有关。

Good luck.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群